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(57) Abstract 

The invention concerns recombinant vectors replicated in mycobacteria, a set of sequences coding for exported polypeptides detected 
by fusion with alkaline phosphatase, in particular one polypeptide, called DP428, of about 12 kD corresponding to an exported protein found 
in mycobacteria belonging to the Mycobacterium tuberculosis complex. The invention also concerns methods and Idts for detecting in vitro 
the presence of a mycobacterium and in particular a mycobacterium belonging to the Mycobacterium tuberculosis complex in a biological 
sample using said polypeptides, their fragments or polynucleotides coding for the latter. The invention also concerns immunogenic or 
vaccine compositions for preventing and/or treating infections caused by mycobacteria and in particular a mycobacterium belonging to said 
complex, particularly tuberculosis. 

(57) Abrege* 

L' invention a pour objet des vecteurs recombinants se replicant chez les mycobactenes, un ensemble de sequences codant pour 
des polypeptides exportes d6tectes par des fusions avec la phosphatase alcaline, notamment un polypeptide, denomme' DP428, d* environ 
12kD coirespondant a une proline exportee retrouvee dans les mycobactenes appartenant au complexe de Mycobacterium tuberculosis. 
L' invention conceme 6galement des precedes et des kits de detection in vitro de la presence d'une mycobacterie et en particulier une 
mycobacterie appartenant au complexe de Mycobacterium tuberculosis dans un echantillon biologique utilisant lesdits polypeptides, leurs 
fragments ou des polynucleotides codant pour ces demiers. L'invention vise des compositions immunogenes ou vaccins pour la prevention 
et/ou le traitement d* infections provoquees par des mycobact6ries et en particulier une mycobacterie appartenant audit complexe, en 
particulier la tuberculose. 
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Sequences nucleiques de polypeptides exportes de 
mycobacterias, vecteurs les comprenant et applications au 
diagnostic et a la prevention de la tuberculosa. 

5 L 1 invention a pour objet de nouveaux vecteurs 

recombinants de criblage, de clonage et/ou d 1 expression se 
rgpliquant chez les mycobacteries . Elle a egalement pour 
objet un ensemble de sequences codant pour des polypeptides 
exporters d6tect6s par des fusions avec la phosphatase 

10 alcaline et dont 1 'expression est regulSe (induite ou 
reprim6e) ou constitutive lors de l 1 ingestion des 
mycobacteries par les macrophages. L' invention concerne 
egalement un polypeptide, denomme DP428, d' environ l2kD 
correspondant a une protfiine exported retrouvee dans les 

15 mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis. L* invention vise aussi un polynucleotide 
comprenant une sequence codant pour ce polypeptide. Elle 
concerne egalement 1 1 utilisation du polypeptide ou de 
fragments de celui-ci et des polynucleotides codant pour 

20 ces derniers (ou encore les polynucleotides complementaires 
a ces derniers) pour la realisation de moyens de detection 
in vitro, ou in vivo de la presence d'une mycobacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 
un Schantillon biologique ou pour la detection de reactions 

25 de l'hote infect§ par ces especes bactSriennes . L 1 invention 
vise enfin 1' utilisation du polypeptide ou de fragments de 
celui-ci ainsi que des polynucleotides codant pour ces 
derniers en tant que moyens destines a la preparation d'une 
composition immunogene, susceptible d'induire une reponse 

30 immunitaire dirig€e contre les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, ou d'une 
composition vaccinale pour la prevention et/ou le 
traitement d' infections provoquees par des mycobacteries 
appartenant audit complexe, en particulier la tuberculose. 

35 
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La pr^sente invention a aussi pour but d'utiliser ces 
sequences (polypeptidiques et polynucl£otidiques) comme 
5 cible pour la recherche de nouveaux inhibiteurs de la 
croissance et de la multiplication des mycobact€ries et de 
leur maintien chez l'hote, ses inhibiteurs pouvant servir 
d'antibiotiques. 

10 Le genre Mycobacterium, qui comprend au moins 56 

especes diffSrentes, inclut des pathogenes humains majeurs 
tels que M. leprae et M. tuberculosis, les agents 
responsables de la lepre et de la tuberculose, qui restent 
des problemes graves de sante publique dans le monde 

15 entier. 

La tuberculose continue d'etre un probleme de sant6 
publique dans le monde. Aujourd"hui, cette maladie est la 
cause de 2 a 3 millions de morts dans le monde et environ 8 

20 millions de nouveaux cas sont observes chaque annee 
(Bouvet, 1994). Dans les pays developpes M. tuberculosis 
est la cause la plus commune des infections 
mycobacteriennes. En France il apparait environ 10 000 
nouveaux cas par an et parmi les maladies £ declaration 

25 obligatoire c»est la tuberculose qui comprend le plus grand 
nombre de cas. La vaccination par le BCG (Bacille de 
Calmette et GuSrin) , une spuche avirulente derivSe de Af . 
bovis et qui est trds utilisSe comme vaccin contre la 
tuberculose, est loin d'etre efficace au sein de toutes les 

30 populations. Cette efficacite varie environ de 80 % dans 
les pays occidentaux comme 1 1 Angleterre, a 0 % en Inde 
(resultats du dernier essai de vaccination a Chingleput 
publics en 1972 dans Indian J. Med. Res.). De plus, 
1' apparition de souches de M. tuberculosis rSsistantes aux 

35 antituberculeux et le risque accru chez les patients 
immunodeprimSs , patients atteints du SIDA, de developper 
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une tuberculose, rendent necessaire la mise au point de 
methodes rapides, specif iques et fiables pour le diagnostic 
de la tuberculose et la mise au point de nouveaux vaccins. 
Par exemple, une 6tude epidemiologique realisee en Floride, 

5 et dont les resultats ont ete publies en 1993 dans AIDS 
therapies, a montre que 10 % des malades atteints de SIDA 
sont atteints de tuberculose au moment du diagnostic du 
SIDA ou 18 mois avant celui-ci. Chez ces malades, la 
tuberculose apparait dans 60 % des cas sous une forme 

10 disseminee done non reperable par les criteres de 
diagnostic classiques comme la radiographie pulmonaire ou 
1' analyse de crachats . 



15 



Actuellement, une certitude sur le diagnostic apporte 
par la mise en evidence de bacilles cultivables dans un 
prelevement provenant du malade n'est obtenue que pour 
moins de la moitie des cas de tuberculose, meme dans les 
cas de tuberculose pulmonaire. Le diagnostic de la 
tuberculose et des autres mycobacteries apparentees est 
20 done difficile a realiser, et cela pour differentes 
raisons : les mycobacteries sont souyent presentes en 
faible quantite, leur temps de generation est tres long 
(24h pour M. tuberculosis) et leur culture est difficile. 
(Bates et al. , 1986) . 



25 



30 



35 



D' autres techniques sont utilisables en clinique, pour 
identifier une infection mycobacterienne : 

a) L' identification directe des microorganismes au 
microscope ; cette technique est rapide, mais ne permet pas 
1' identification de l'espece mycobacterienne observee et 
manque de sensibilite (Bates, 1979) . 

Les cultures, lorsqu'elles sont positives, ont une 
specif icite approchant 100 % et permettent 1 ' identification 
de l'espece mycobacterienne isolee ; neanmoins, comme 
precise ci-dessus, la croissance des mycobacteries in vitro 
est longue (ne peut etre realisee qu'en 3 a 6 semaines de 
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cultures repetees (Bates, 1979 ; Bates et al . , 1986)) et 
coQteuse . 

b) Les techniques serologiques peuvent s'avtrer utiles 
5 dans certaines conditions, mais leur utilisation est 
parfois limitee par leur sensibilite et/ou leur specificite 
faibles (Daniel et al . , 1987). 



to 



c) La presence de mycobacteries au sein d'un 
echantillon biologique peut aussi etre determinee par 
hybridation molSculaire avec de l'ADN ou de l'ARN en 
utilisant des sondes d' oligonucleotides specif iques des 
sequences recherchees (Kiehn et al . , 1987 ; Roberts et al.. 
1987 ; Drake et al., 1987). Plusieurs etudes ont montre 
15 1'interSt de cette technique pour le diagnostic des 
infections a mycobacteries. Les sondes utilisees sont 
constitutes d'ADN, d'ARN ribosomique ou de fragments d'ADN 
mycobacteriens provenant de banque de genes. Le principe de 
ces techniques repose sur le polymorphisme des sequences 
20 nucleotidiques des fragments utilises ou sur le 
polymorphisme des regions avoisinantes . Dans tous les cas, 
elles necessitent 1 -utilisation de cultures et ne sont pas 
applicables directement sur les echantillons biologiques. 

25 La faible quantite de mycobacteries presentes au sein 

d'un echantillon biologique et en consequence la quantite 
faible d'ADN cible a detecter dans cet echantillon peut 
necessiter le recours a une amplification specifique in 
vitro de l'ADN cible avant sa detection a l'aide de la 

30 sonde nucleotidique et en utilisant des techniques 
d- amplification in vitro telles que la PCR (amplification 
en chaine a la polymerase. L' amplification specifique de 
l'ADN par la technique PCR peut constituer la premiere 
etape d'un procede de detection de la presence d'un ADN 

35 mycobacterien dans un echantillon biologique, la detection 
proprement. dite de l'ADN amplifiS g tan t effectuee dans un 
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second temps a l'aide d'une sonde oligonucleotidique 
capable de s'hybrider specif iquement a l'ADN amplifie. 

Un test, de detection de mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 
sandwich (test utilisant une sonde de capture et une sonde 
de detection) a et6 decrit par Chevrier et al . en 1993. l e 
complexe de Mycobacterium tuberculosis est un groupe de 
mycobacteries qui comprend M. bovis-BCG, M. bovis, M. 
tuberculosis, M. africanum et M. microti. 

Un procede de detection de faibles quantites de 
mycobacteries, appartenant au complexe tuberculosis, par 
amplification genique et hybridation directement sur des 
echantillons biologiques a et6 mis au point. Ledit procede 
utilise la sequence d' insertion IS6110 (Brevet europeen EP 
0 490 951 Bl). Thierry et al . ont decrit en 1990 une 
sequence specifique du complexe Mycobacterium tuberculosis 
et nominee IS 6110. Certains auteurs ont propose 
d 'amplifier specif iquement l'ADN provenant de 
Mycobacterium en utilisant des amorces nucleiques dans une 
methode d' amplification, telle que la reaction de 
polymerase en chaine (PCR) . Patel et al . ont decrit en 1990 
1 'utilisation de plusieurs amorces nucleiques choisies a 
partir d'une sequence connue en tant que sonde dans 
1' identification de M. tuberculosis. Cependant, la longueur 
des fragments obtenus en utilisant ces amorces etait 
dif f erente de la longueur theorique attendue et plusieurs 
fragments de taille variable etaient obtenus. De plus, les 
auteurs ont observe 1- absence d' hybridation des produits 
amplifies avec le plasmide ayant servi a determiner les 
amorces. Ces resultats indiquent que ces amorces ne 
seraient pas appropriees dans la detection de la presence 
de M. tuberculosis dans un echantillon biologique et 
confirment la nature critique du choix des amorces. La meme 
annee, J.L. Guesdon et D. Thierry ont decrit une methode de 
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detection de M. tuberculosis, de grande sensibility, par 
amplification d'un fragment d 1 ADN de M. tuberculosis 
localise au sein de la sequence IS6110 (Brevet europ6en EP 
461 045) a l'aide d 1 amorces g6n6rant des fragments d • ADN 

5 amplifiS de longueur constante, meme lorsque le choix des 
amorces conduisait § 1 1 amplification de fragments longs (de 
l'ordre de 1000 £ 1500 bases) oO le risque d' interruption 
de la polymerisation est 61ev6e en raison des effets de la 
structure secondaire de la sequence. D'autres amorces 

10 spScifiques de la sequence IS6110 sont decrites dans le 
brevet europ£en N° EP-0490 951. 

Les inventeurs ont montre (resultats non publies) que 
certains isolats cliniques de Mycobacterium tuberculosis 

15 6taient exempts de la s6quence d' insertion IS6110 et ne 
pouvaient done etre d6tect6s a l'aide des oligonucleotides 
specif iques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement n£gatifs. Ces resultats 
confirment une observation similaire- faite par Yuen et al . 

20 en 1993. L 1 impossibility de dStecter ces souches pathogenes 
potentiellement presentes dans un echantillon biologique 
preleve sur un patient est ainsi susceptible de conduire a 
des difficulty voire des erreurs de diagnostic. La 
disponibilite de plusieurs sequences specif iques du Bacille 

25 de la tuberculose, S l'int£rieur desquelles des amorces 
appropri£es pour 1 • amplification seront choisis, est 
importante. La sequence DP428 dScrite ici pourra etre 
utilisee. 

30 bovis et M. tuberculosis, les agents causals de la 

tuberculose, sont des bacteries facultatives intra- 
cellulaires. 

Ces agents ont dSveloppS des m^canismes pour assurer 
35 leur survie et leur replication a I'intSrieur du 
macrophage, un des types cellulaires qui est suppose 
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eradiquer 1 ' invasion par des microorganismes . Ces agents 
sont capables de moduler 1' evolution normale de leur 
phagosome et de les empecher de se differencier en un 
compart iment acide riche en hydrolase (Clemens, 1979 ; 
Clemens et al . , 1996; Sturgill-Koszycki et al . , 1994 et Xu 
et al., 1994). Cependant, cette modulation n'est possible 
que si la bacterie est vivante au sein du phagosome, 
suggerant que des composes synthetises de maniere active 
et/ou secretes a l'interieur de la cellule font partie de 
ce mecanisme. Des proteines exportees sont probablement 
impliquees dans ce mecanisme. En depit des problemes 
majeurs de sante lies a ces organismes pathogenes, on sait 
peu de choses sur leurs proteines exportees et/ou 
secretees. Des analyses en SDS-PAGE de filtrat de culture 
de M. tuberculosis montrent au moins 30 proteines secretees 
(Altschul et al., 1990 ; Nagal et al . , 1991 et Young et 
al., 1992). Certaines d'entre elles ont ete caracterisees, 
leurs genes clones et sequences (Borremans et al., 1989 ; 
Wiker et al., 1992 et Yamaguchi et al . . 1989). D'autres, 
20 bien qu'il s'agisse d'antigenes immunodominants 
d' importance majeure pour induire une immunite protectrice 
(Anderson et al.,1991 et Orme et al . , 1993), ne sont pas 
totalement identifies. En outre, il est probable que de 
nombreuses proteines exportees restent fixees sur la 
25 membrane cellulaire et par consequent ne soient pas 
presentes dans les surnageants de culture. II a ete montre 
que les proteines localisees a la surface externe de 
diverses bacteries pathogenes, telles que l'invasine de 103 
kDa de Yeraina Pseudotuberculosis (Isberg et al., 1987) ou 
30 l'internaline de 80 kDa de Listeria monocytogenes (Gaillard 
et al., 1991 et Dramsi et al., 1997) jouent un r61e 
important dans les interactions avec les cellules h6tes et 
par consequent, dans la pathogenicity comme dans 
1' induction de reponses protectrices . Ainsi, une proteine 
35 li£e a la membrane pourrait etre importante pour 
1' infection a M. tuberculosis comme pour 1' induction de 
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r§ponse protectrice contre cette infection. Ces proteines 
pourraient revetir un interet certain pour la preparation 
de vaccins. 

5 R6cemment, il a 6t6 ddcrit 1' adaptation aux 

mycobact^ries d'une mfithodologie g6n6tique pour 
1 1 identification et la selection ph6notypique de prot6ines 
export6es (Lim et al., 1995). Cette methode utilise la 
phosphatase alkaline (PhoA) p6riplasmique d'E. coJi. Un 
10 vecteur plasmidique a 6te construit permettant la fusion de 
genes entre un gene PhoA tronquS et des genes codant pour 
des proteines export^es (Manoil et al . , 1990). 

Par cette methode, il a pu etre identifi6 un gene 
de M. tuberculosis (erp (Berthet et al., 1995)) prgsentant 
des homologies avec une protSine export£e de 28 kDa de M. 
leprae, qui est une cible frequente des reponses humorales 
de la forme lepromateuse de la lepre. Une proteine 
presentant des motifs aminoacides caracteristiques de la 
desaturase de plante (des) a aussi 6te caract6ris§e par la 
technique de fusion avec PhoA. 

Cependant, cette mSthode genetique d 1 identification 
de prolines exportfies ne permet pas d'Svaluer facilement 
25 1» expression intracellulaire des gSnes correspondants . Une 
telle Evaluation est d'une importance primordiale a la fois 
pour la selection de bons candidats vaccins et pour la 
comprehension des interactions entre les bact€ries et leurs 
cellules hotes. L 1 induction de 1" expression de facteur de 
30 virulence par contact de cellule cible pathogSne a 6te 
dEcrite. C'est le cas par exemple pour les facteurs de 
virulence Yops (Petersson et al . , 1996) de Yersinia 
pseudotuberculosis. Shigella par contact avec les cellules 
cibles relargue les proteines Ipa dans le milieu de 
35 culture, .et Salmonella synthetise de nouvelles structures 
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de surface . 

Compte tenu de ce qui precede, il existe aujourd'hui 
un grand besoin de developper de nouveaux vaccins contre 
5 les mycobacteries pathogenes ainsi que de nouveaux tests de 
diagnostic specif iques, fiables et rapides. Ces 
developpements necessitent la mise au point d'outils 
specif iques encore plus performants permettant, d'une part, 
d'isoler ou d'obtenir des sequences de nouveaux 

10 polypeptides specifiques, notamment immunogenes, et, 
d' autre part, de mieux comprendre le mecanisme des 
interactions entre les bacteries et leurs cellules hdtes 
comme notamment 1' induction de 1 ' expression de facteur de 
virulence . Ceci est precisement l'objet de la presente 

15 invention. 
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Les inventeurs ont defini et realise dans ce but de 
nouveaux vecteurs permettant le criblage, le clonage et/ou 
1' expression de sequences d'ADN de mycobacteries afin 
d- identifier parmi ces sequences, des acides nucleiques 
codant pour des proteines d'interet, de preference des 
proteines exportees, pouvant etre localisees sur la 
membrane bacterienne et/ou secretees, et d' identifier parmi 
ces sequences celles qui sont induites ou reprimees lors de 
25 1' infection (croissance intracellulaire) . 

Description 

La presente invention decrit 1 'utilisation du gene 
30 rapporteur phoA chez les mycobacteries. II permet 
d' identifier des systemes d- expression et d' exportation 
dans un contexte mycobacterien . Beaucoup de genes ne sont 
exprimes que dans un tel contexte, ce qui montre l'avantage 
de la presente invention. Au cours du clonage de segments 
35 d'ADN de souches du complexe M. Tuberculosis en fusion avec 
phoA dans une autre mycobacterie comme M. smegmatis, le 
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debut du gene, ses regions regulatrices et son regulateur 
seront clones ce qui permettra d' observer une regulation. 
Si cette regulation est positive, le clonage du regulateur 
constituera un avantage pour observer 1' expression et 
5 1 'exportation. 

Dans le contexte de 1' invention, on entend par 
mycobacterie toutes les mycobacteries appartenant aux 
di verses especes enumerees par Wayne L. G. and Kubica G. P. 
10 (1980). Family Mycobacteriaceae in Bergey's manual of 
systematic bacteriology, J. P. Butler Ed. (Baltimore USA : 
Williams et Wilkins P. 1436-1457). 

Dans certains cas les genes clones sont soumis dans 
15 leur h6te d'origine a une regulation negative rendant 
l'observation de l'expression et de 1 'exportation difficile 
chez l'hote d'origine. Dans ce cas, le clonage du gene en 
absence de son regulateur negatif, dans un note ne le 
contenant pas, constituera un avantage. 
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L' invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayant pu etre 
isoles au moyen des vecteurs precedents et susceptibles 
d'entrer dans la realisation de compositions pour la 
detection d'une infection par des mycobacteries, ou pour la 
protection contre une infection due a des mycobateries ou 
pour la recherche d ' inhibiteurs comme cela est decrit 
precedemment pour DP428. 



L' invention a done pour objet un vecteur recombinant 
de criblage, de clonage et/ou d' expression, caracterise en 
ce qu'il se replique chez des mycobacteries et en ce qu'il 
contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 
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3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) §ventuellement un terminateur de transcription 
5 actif chez les mycobact^ries, en amont du polylinker, 

c) uhe sequence nuclgotidique codante issue d ! un gene 
codant pour un marqueur d 1 expression, d * exportation et/ou 
de secr6tion de proline, ladite sequence nucl6otidique 
etant dgpourvue de son codon d' initiation et de ses 

10 sequences de regulation, et 

d) une sequence nuclSotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le mSme fragment, ladite sequence nucleotidique etant 
pourvue de son codon d' initiation . Eventuellement , le 

15 vecteur recombinant contient egalement un rSplicon 
fonctionnel chez E. coli. 

De maniere pr6f6ree, le marqueur d ' exportation et/ou 
de secretion est place dans la mime orientation que le 
marqueur d'activite de promoteurs. 



2() 



25 



PrSferentiellement, le vecteur recombinant de criblage 
selon l 1 invent ion comprendra, en outre, un terminateur de 
transcription placS en aval du marqueur d'activite de 
promoteurs, ce qui est de nature a permettre l'obtention de 
transcrits courts qui se r6v£lent plus stables et qui, par 
consequent, permettent un plus haut niveau d' expression des 
produits de traduction. 

Le marqueur d» exportation et/ou de sScrStion est une 
sequence de nucleotides dont i» expression suivie de 
l f exportation et/ou de la secretion depend des Elements de 
regulation qui controlent son expression. 

35 Par "sequences ou elements de regulation de 

l 1 expression de la production de polypeptides et de sa 
localisation", on entend une sequence promotrice de la 
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transcription, une sequence comprenant le site de liaison 
au ribosoroe (RBS) , les sequences responsables de 
1 'exportation et/ou la secretion telles que la sequence 
dite sequence signal. 

Un premier marqueur interessant d ' exportation et/ou 
d' expression est une s6quence codante issue du gene phoA. 
Le cas echeant, elle est tronquee de telle facon que 
l'activite phosphatase alcaline est cependant susceptible 
d'etre restauree lorsque la sequence codante tronquee est 
placee sous le controle d'un promoteur et d' elements de 
regulation appropries. 

D'autres marqueurs d' exposition, d' exportation et/ou 
de secretion peuvent etre utilises. On citera a titre 
d'exemples une sequence du gene p-agarase, de la nuclease 
d'un staphylocoque ou d'une 0- lactamase. 

Parmi les marqueurs interessants d'activite de 
promoteurs contenus dans le meme fragment, on prefere une 
sequence codante issue du gene luc de luciferase de luciole 
pourvue de son codon d' initiation. 

D'autres marqueurs d'activite de promoteurs contenus 
dans le meme fragment peuvent etre utilises. On citera a 
titre d'exemples une sequence du gene de la GFP (Green 
Fluorescent Protein) . 



Le terminateur de transcription doit etre fonctionnel 
30 chevies mycobacteries . Un terminateur avantageux est a cet 
egard le terminateur du coliphage T4 (tT4) . D'autres 
terminateurs appropries pour la realisation de 1' invention 
peuvent etre isoles en utilisant la technique presentee 
dans les exemples, par exemple au moyen d'une cassette 
35 "omega" (Prentki et al . , 1984). 
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Un vecteur particulierement prefere pour la 
realisation de 1 ' invention est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM (Collection Rationale 
de Cultures de Microorganismes, 25 rue de Docteur Roux, 
5 75724 Paris cedex 15, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, l e 12/12 

1996, 

b) pJVEDb depose a la CNCM sous le N» 1-1906, le 25 
10 juillet 1997, 

c) pJVEDc depose a la CNCM sous le N° I -179 9 , l e 
12/12 1996. 
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Pour la selection, ou 1 ' identification de sequences 
d'acides nucleiques de mycobacteries codant pour, des 
polypeptides susceptibles d'etre incorpores dans des 
compositions immunogenes, ou antigeniques pour la detection 
d'une infection, ou susceptibles d'induire ou de reprimer 
un facteur de virulence de mycobacteries, le vecteur de 
1' invention comprendra, en l'un des sites de clonage 
multiple du polylinker, une sequence de nucleotides d'une 
mycobacterie chez laquelle on detecte la presence de 
sequences correspondant a des polypeptides exportes et/ou 
secretes pouvant etre induits ou reprimes lors de 
1' infection, ou encore exprimes ou produits de facon 
constitutive, leurs sequences promotrices et/ou 
regulatrices associees susceptibles de permettre ou de 
favoriser 1 ' exportation et/ou la secretion desdits 
polypeptides d'interet, ou tout ou partie de genes 
d'interet codant pour lesdits polypeptides. 

De preference, cette sequence est obtenue par 
fragmentation physique ou par digestion enzymatique de 
l'ADN genomique ou de l'ADN complementaire d'un ARN d'une 
mycobacterie, de preference M. tuberculosis ou choisie 
parmi M. africanum, M. bovis, M. avium ou M. leprae. 
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Les vecteura de 1' invention peuvent en effet egalement 
etre utilises pour determiner la presence de sequences 
d'interet, de preference correspondent a des proteines 
exporters et/ou secretees, et/ou capables d'etre induites 
ou reprimees ou produites de facon constitutive lors de 
1' infection, notamment lors de la phagocytose par les 
macrophages, et selon ce qui a 6te exposfi precedemment , 
chez des mycobacteries telles que M. africanum, M. bovis, 
M. avium ou M. leprae dont on aura traite l'ADN ou l'ADNc 
par fragmentation physique ou avec des enzymes d6terminees. 

Selon un premier mode de realisation de 1' invention la 
digestion enzymatique de l'ADN genomique ou de l'ADN 
complementaire est effectuee a partir de M. tuberculosis. 

De preference cet ADN est digere avec une enzyme telle 
que sau3A, BclI,BglII. 



D'autres enzymes de digestion telles que Seal, Apal. 
Sad I, Kpnl ou encore des nucleases ou des polymerases, 
20 peuvent naturellement etre mises en oeuvre, des lors 
qu'elles permettent l'obtention de fragments dont les 
extremites peuvent §tre inserees dans l'un des sites de 
clonage du polylinker du vecteur de 1' invent ion. 

Le cas echeant, des digestions avec differentes 
25 enzymes seront effectuees simultanement . 

Des vecteurs recombinants preferes pour la realisation 
de 1' invention sont choisis parmi les vecteurs recombinants 
suivants deposes a la CNCM : 

30 a) P 6D7 depose le 28 janvier 1997 a la CNCM sous le N»I- 
1814, 

b) P 5A3 depose le 28 janvier 1997 a la CNCM sous le N»I- 
1815, 

c) p5P6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
35 1816, 

d) P 2A29 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1817, 
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e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1820, 

h) p2D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 

i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843, 

j) pJVED/M. tuberculosis depose le 25 juillet 1997 a la 

CNCM sous le N° 1-1907, 
k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 

Parmi les plus preferes, on prefere le vecteur 
recombinant pDP428 depose le 28 janvier 1997 a la CNCM sous 
le N°I-1818, et le vecteur pMlC25 depose le 4 aout 1998 a 
la CNCM sous le N° 1-2062. 



L' invention a egalement pour objet un procede de 
criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 

25 pouvant §tre induits ou reprimes lors de 1' infection, leurs 
sequences promotrices et/ou regulatrices associees 

susceptibles notamment de permettre ou de favoriser 
1' exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 

30 lesdits polypeptides, caracterise en ce qu'il met en oeuvre 
un vecteur recombinant selon 1' invention. 

L' invention concerne aussi un procede de criblage, 
selon 1' invention, caracterise en ce qu'il comprend les 
Stapes suivantes : 



a) la fragmentation physique des sequences d'ADN de 
mycobacteries ou leur digestion par au moins une enzyme 
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determinee et la recuperation des fragments obtenus ; 

b) 1' insertion des fragments obtenus a l'etape a) dans 
un site de clonage, compatible le cas echeant avec 1' enzyme 
de l'etape a), du polylinker d'un vecteur selon 
1' invention ,• 

c) si besoin, 1' amplification desdits fragments 
contenus dans le vecteur, par exemple par replication de ce 
dernier apres insertion du vecteur ainsi modifi6 dans une 
cellule determinee, de preference E coli ; 

d) la transformation des cellules notes par le vecteur 
amplifie a l'etape c) , ou en l'absence d' amplification, par 
le vecteur de l'etape b) ; 

e) la culture des cellules h6tes transformees dans un 
milieu permettant la mise en evidence du marqueur 

15 d' exportation et/ou de secretion. et /ou du marqueur 
d'activite de promoteurs contenu dans le vecteur ; 

f) la detection des cellules notes positives (colonies 
positives) pour 1' expression du marqueur d ' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 

20 promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1' insertion de cet ADN dans une cellule identique a celle 
de l'etape c) ; 

h) la selection des insertions contenues dans le 
vecteur, permettant l'obtention de clones positifs pour le 
marqueur d' exportation et/ou de secretion, et /ou pour le 
marqueur d' activity de promoteurs ; 

i) l'isolement et la caracterisation des fragments 
d' adn de mycobacteries contenues dans ces inserats. 
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Dans l'un des modes de realisation preferes du procede 
de criblage selon 1- invention, les cellules notes 
positives, detectees a l'etape f ) , pour le marqueur 
d' exportation et/ou de secretion sont, eventuellement dans 
un second temps, testees pour la capacite de 1- insert 
nucleotidique selectionne a stimuler 1' expression du 
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marqueur d'activite de promoteurs lorsque lesdites cellules 
hStes sont phagocytees par des cellules du type 
macrophagique . 

De maniere plus specifique, on compare la stimulation 
de 1' expression du marqueur d'activite de promoteurs chez 
des cellules notes placees en culture axenique (cellules 
h6tes seules en culture) a la stimulation de 1' expression 
du marqueur d'activite de promoteurs chez des cellules 
hates cultivees en presence de macrophages et ainsi 
phagocytees par ces derniers. 

La selection de cellules notes positives pour le 
marqueur d'activite de promoteurs peut Stre realisee des 
1 'Scape e) du procede de criblage decrit ci-dessus, ou 
encore apres l'une quelconque des etapes f ) , g) , h) ou i) , 
c'est-a-dire une fois que les cellules hotes ont ete 
selectionnees positivement pour le marqueur d' exportation 
et/ou de selection. 

La mise en oeuvre de ce procede permet la construction 
de banques d'ADN comportant des sequences correspondant a 
des polypeptides susceptibles d'etre exportes et/ou 
secretes, et/ou susceptibles d'etre induits ou reprimes 
lors de 1' infection lorsqu'ils sont produits au sein de 
mycobacteries recombinantes . L'etape i) du procfide peut 
comprendre une 6tape de sequencage des insertions 
selectionnees. 

30 De preference, dans le procede selon 1' invention, le 

vecteur utilise est choisi parmi les plasmides pJVEDa 
(CNCM, N o 1-1797), pJVEDb (CNCM, N<> 1-1906), pJVEDc (CNCM. 
N o 1-1799) ou pJVED/M. tuberculosis (CNCM, N°I-1907) , et la 
digestion des sequences d'ADN de mycobacteries est 

35 effectuee au moyen de 1' enzyme Sau3A. 

Selon un mode de realisation prefere de 1' invention, 
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le procede de criblage est caracterise en ce que les 
sequences de mycobacteries sont issues d'une mycobacterie 
pathogene, par exemple de M. tuberculosis, M. bovis, M. 
avium, M. africanum ou M. leprae. 

5 

L' invention comprend egalement une banque d'ADN 
genomique ou d'ADNc complementaire d'ARNm de mycobacterie, 
caracterisee en ce qu'elle est obtenue par un procede 
comprenant les etapes a)et b) , ou a), b) et c) du procede 
10 precedent selon 1' invention, de preference une banque d'ADN 
genomique ou d'ADNc complementaire d'ARNm de mycobacteries 
pathogenes, de preference de mycobacteries appartenant au 
groupe du complexe Mycobacterium tuberculosis, de 
preference de Mycobacterium tuberculosis. 

15 

Dans la presente invention, on entend designer par 
"sequences nucleiques" ou "sequences d'acides amines" SEQ 
ID N» X a SEQ ID N» Y, ou X et Y peuvent representer 
independamment un nombre ou un caractere alphanumerique, 
20 respect ivement 1' ensemble des sequences nucleiques ou 
1' ensemble des sequences d'acides amines representees par 
les figures X a Y, extremitSs comprises. 

Par exemple, les sequences nucleiques ou les sequences 
25 d'acides amines SEQ ID N° la SEQ ID N° 4N sont 
respect ivement les sequences nucleiques ou les sequences 
d'acides amines representees par les figures 1 a 4N, c'est- 
a-dire respectivement les sequences nucleiques ou les 
sequences d'acides amines SEQ ID N° 1, SEQ ID N« 1A' , SEQ 
30 ID N° IB', SEQ ID N» 1C , SEQ ID N° ID, SEQ ID N° if! SEQ 
ID No 2, SEQ ID N° 3A, SEQ ID N<> 3B, SEQ ID N° 3C, SEQ ID 
N» 4A, SEQ ID No 4B, SEQ ID N» 4C, SEQ ID N» 4A' , SEQ ID N» 
4B', SEQ ID N o 4C, SEQ ID N» 4F, SEQ ID N» 4J, SEQ ID N° 
4K, SEQ ID No 4L, SEQ ID N° 4M et SEQ ID N° 4N. 



L ' invention a egalement pour objet les sequences 
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nucleotidiques de mycobacteries ou comprenant des sequences 
nucleotidiques de mycobacteries select ionnees apres la 
realisation du proc6de selon 1' invention ci-dessus decrit . 

De preference, ladite mycobacterie est choisie parmi M. 
tuberculosis, M. bovis, M. africanum, M. avium, M. leprae, 
M. paratuberculosis, M. kansassi ou M. xenopi. 

On pr^fere les sequences nucleotidiques de mycobacteries 
ou comprenant une sequence nucleotidique de mycobacterie, 
ladite sequence nucleotidique de mycobacterie etant choisie 
parmi les sequences de fragments d'ADN de mycobacterie de 
sequence nucleique SEQ ID N<» l a SEQ ID N° 24C, SEQ ID N° 
27A a SEQ ID N° 27C, SEQ ID N' 29 et SEQ ID N° 31A a SEQ ID 
N° 50F, respect ivement representees par les figures 1 a 24C 
(planches 1 a 150), par les figures 27A a 27C (planches 152 
a 154), par la figure 29 (planche 156) et par les figures 
31A a 50F (planches 158 a 275). 

Selon un mode de realisation particulier de 1' invention, 
des sequences preferees sont par exemple les fragments 
d'ADN de mycobacteries de sequence SEQ ID N°l, SEQ ID N°3A, 
SEQ ID N»5A, SEQ ID N»6A, SEQ ID N°7A, SEQ • ID N«»8A, SEQ ID 
N«9A, SEQ ID N»10A, SEQ ID N«27A ou SEQ ID N°29 contenus 
respect ivement dans les vecteurs pDP428 (CNCM, N°I-1818) 
P6D7 (CNCM, N»I-1814), p5F6 (CNCM, N°I-1816), p2A29 (CNCm! 
N-I-1817), P 5B5 (CNCM, N«I-1819) , P 1C7 (CNCM, N°I-1820)! 
P2D7 (CNCM.Noi-1821), plB7(CNCM, N-I-1843) , p5A3 (CNCm! 
N«I-1815) et pMlC25 (CNCM, n°I-2062) . 

L' invention concerne egalement un acide nucleique 
comprenant la totalite de la phase de lecture ouverte d'une 
des sequences nucleotidiques selon 1' invention, notamment 
une des sequences SEQ ID N° 1 a SEQ ID N° 24C, SEQ ID N 6 
27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A a SEQ ID 
N° 50F selon 1' invention. Ledit acide nucleique peut etre 
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isol£ par exemple de la facon suivante : 

a) preparation d'une banque de cosmides a partir de l'ADN 
de M. tuberculosis, par exemple selon la technique decrite 
par Jacobs et al., 1991; ^ 

b) hybridation de tout ou partie d'un acide nucleique 
sonde de sequence choisie par exemple parmi SEQ ID N° 1 a 
SEQ ID N° 24C, SEQ ID N° 27A a SEQ ID N° 27 C , SEQ ID N° 29 
et SEQ ID N° 31A a SEQ ID N° 50F avec les cosmides de la 
banque prealablement preparee a l'etape a) ; 

c) selection des cosmides hybridant avec 1' acide 
nucleique sonde de l'Stape b) ; 

d) sequencage des inserts d'ADN des clones select ionnes a 
l'etape c) et identification du cadre de lecture ouvert 

15 complet ; 

e) le cas echeant, clonage des inserts sequences a 
l'etape d) dans un vecteur d' expression et/ou de clonage 
approprie . 
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Les acides nucleiques comprenant la totalite du cadre de 
lecture ouvert des sequences SEQ ID N° 1 a SEQ ID N° 24C, 
SEQ ID N° 27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 
31A a SEQ ID N» 50F sont parmi les acides nucleiques 
pr#f eres . 

La presente invention permet de determiner un fragment 
de g$ne codant pour un polypeptide exporte. La comparaison 
avec la sequence du genome publiee par Cole et al . (Cole et 
al., 1998, Nature, 393, 537-544) permet de determiner le 
gene en entier portant la sequence identifiee selon la 
presente invention. 

Par sequence nucleotidique comprenant la totalite du 
cadre ouvert de lecture d'une sequence selon 1- invention, 
on entend la sequence nucleotidique (genomique, ADNc, semi- 
synthetique ou synthetique) comprenant l'une des sequences 
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selon 1' invention et s'etendant d'une part en 5' de ces 
sequences jusqu'au premier codon d' initiation de la 
traduction (ATG ou GTG) ou meme jusqu'au premier codon 
stop, et d' autre part en 3' de ces sequences jusqu'au codon 
stop suivant, et ceci dans l'une quelconque des trois 
phases de lecture possibles. 



Les sequences nucleotidiques complementaires des 
sequences ci-dessus selon 1' invention font egalement partie 
10 de 1' invent ion. 

Par polynucleotide de sequence complementaire d'une 

sequence nucleotidique selon 1' invention, on entend toute 

sequence d'ADN ou d'ARN dont les nucleotides sont 

15 complementaires de ceux de ladite sequence selon 
1" invention et dont 1' orientation est inversee. 

Les fragments nucleotidiques des sequences ci-dessus 
selon 1' invention notamment utiles en tant que sondes ou 
amorces font egalement partie de 1' invention. 

L' invention concerne aussi les polynucleotides 
caracterises en ce qu'ils comprennent un polynucleotide 
choisi parmi : 

a) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide selon 1' invention, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon 1' invention, 

c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon 
1' invention, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon 1' invention. 

Les conditions de forte stringence ainsi que le 
pourcentage d'identite seront definis ci-apres dans la 
presente description. 
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Lorsque la sequence codante issue du gene marqueur 
d' exportation et/ou de secretion est une sequence issue du 
gene phoA, 1 ' exportation et/ou la secretion du produit du 
5 gene phoA, le cas echeant tronque, n'est obtenue que 
lorsque cette sequence est inseree en phase avec la 
s6quence ou element de regulation de 1' expression de la 
production de polynucleotides et sa localisation placee en 
amont, qui contient les Elements controlant 1' expression, 
10 l' exportation et/ou la secretion issus de sequence de 
mycobacter ies . 

Les vecteurs recombinants de 1' invention peuvent bien 
entendu comprendre des sites de clonage multiples decales 
15 de un ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant ainsi d'exprimer le polypeptide 
correspondant au fragment d'ADN de mycobacterie insere et 
susceptible d'etre traduit selon l'un des trois cadres de 
lecture possibles. 



Par exemple les vecteurs preferes pJVEDb et pJVEDc de 
1' invention se distinguent du vecteur prefere pJVEDa par un 
decalage respect if de un et de deux nucleotides au niveau 
25 du site de clonage multiple. 

Ainsi, les vecteurs de 1' invention sont capables 
d'exprimer chacun des polypeptides susceptibles d'etre 
codes par un fragment d'ADN de mycobacterie insere. Cesdits 
30 polypeptides, caracterises en ce qu'ils sont done 
susceptibles d'etre exportes et/ou secretes, et/ou induits 
ou reprimes, ou exprimes de facon constitutive lors de 
1' infection, font partie de 1' invention. 

35 On prefere notamment les polypeptides de 1' invention 

dont les sequences d'acides amines sont choisies parmi les 
sequences d'acides amines SEQ ID N° la SEQ ID N° 24C, SEQ 
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ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 50F et 
representees respect ivement par les figures 1 a 24C 
(planches 1 H 150) , les figures 21 A a 28 (planches 152 a 
155) et les figures 30 & 50F (planches 157 £ 275) . 

5 

Font Sgalement partie de 1" invention, les fragments ou 
fragments biologiquement actifs ainsi que les polypeptides 
homologues desdits polypeptides. Fragment, fragment 
biologiquement actif et polypeptides homologue de 
10 polypeptide, 6tant tels que dSfinis ci-apr&s dans la 
description. 

L f invention concerne 6galement les polypeptides 
comprenant un polypeptide ou un de leurs fragments selon 
15 I 1 invention. 

L 1 invention a aussi pour objet des mycobactSries 
recombinantes contenant un vecteur recombinant selon 
1' invention decrit precedemment . Une mycobactSrie prSferee 
20 est une mycobact£rie du type M . smeqmatis . 

M. smeqmatis permet avantageusement de tester 
l'efficacit6 de sequences de mycobacteries, pour le 
controle de 1 •expression, de 1 ' exportation et/ou de la 
s6cr6tion, et/ou de I'activite de promoteurs d'une sequence 
25 donnee, par exemple d'une sequence codant pour un marqueur 
tel que la phosphatase alcaline et/ou la lucif erase. 

Une autre mycobactSrie pr£f£r£e est une mycobactSrie du 
type AT. bovis, par exemple la souche BCG utilisee 
30 actuellement pour la vaccination contre la tuberculose. 

Une autre mycobact6rie prSferee est une souche de M. 
tuberculosis, M. bovis ou M. africanum possSdant 
potentiellement tous les systemes de regulation appropries. 



Les inventeurs ont ainsi caract£ris6 en particulier un 
polynucleotide constituS par une sequence de nucleotides 
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presente chez toutes les souches testees de mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis. Ce 
polynucleotide, denomme DP428 contient un cadre ouvert de 
lecture (ORF) codant pour un polypeptide d' environ 12 kD. 
Le cadre de lecture ouvert (ORF) codant pour le polypeptide 
DP428 s'etend du nucleotide en position nt 941 au 
nucleotide en position nt 1351 de la sequence SEQ ID N° 2, 
le polypeptide DP428 ayant la sequence en acides amines SEQ 
ID N° 28 suivante : 

MKTGTATTRRRLLAVLIALALPGAAVALLAEPSATGASDPCAASEVARTVGSVAKSMGD 

YLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPKVASDLHALSQPLTDLSTRCSLP 
ISGLQAIGLMQAVQGARR . 

Ce poids moleculaire(PM) correspond au PM theorique de 
la proteine mature obtenue apres clivage de la sequence 
signale, le PM de la proteine ou polypeptide DP428 etant 
d' environ 10 kD apres ancrage potentiel au peptidoglycane 
et coupure potentielle entre S et G du motif LPISG. 

Ce polynucleotide inclut, d'une part, un cadre ouvert de 
lecture correspondant a un gene de structure et, d' autre 
part, les signaux de regulation de 1' expression de la 
sequence codante en amont et en aval de cette derniere.Le 
polypeptide DP428 est compose d'un peptide signal, d'une 
region centrale hydrophile et d'une region C-terminale 
hydrophobe. Cette derniere se termine par deux residus 
arginines (R), signal de retention, et est precede par un 
motif LPISG qui rappelle le motif LPXTG d'ancrage au 
peptidoglycane (Schneewind et al., 1995). 



Par gene de structure aux fins de la presente invention, 
on entend un polynucleotide codant pour une proteine, un 
polypeptide ou encore un fragment de ces derniers, ledit 
polynucleotide ne comprenant que la sequence correspondant 
35 au cadre ouvert de lecture (ORF) , ce qui exclut les 
sequences du cote 5 • du cadre ouvert de lecture (ORF) qui 
dirigent 1' initiation de la transcription. 
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Ainsi, 1' invention concerne en particulier un 

polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l a SEQ ID N°2. 

Plus particuli&rement, l 1 invention concerne un 

polynucleotide caract6ris6 en ce qu'il comprend un 
polynucleotide choisi parmi : 



a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucl6otidiques SEQ ID N°l a SEQ ID N°2, 

b) un polynucleotide dont la sequence nucieique est la 
sequence comprise entre le nucleotide en position nt 964 
et le nucleotide en position nt 1234, extremites indues, 

15 de la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) ,c) ou d) , 

f) un fragment d*au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 



On enterid par sequence nucl6otidique, polynucleotide 
ou acide nucieique, selon la presente invention, aussi bien 
un ADN double brin, un ADN simple brin que des produits de 
transcription desdits ADN. 



Par pourcentage d'identite au sens de la presente 
invention, on entend un pourcentage d'identite entre les 
bases de deux polynucleotides, ce pourcentage etant 
purement statistique et les differences entre les deux 
35 polynucleotides etant reparties au hasard et sur toute 
leur longueur. 
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Une hybridation dans des conditions de forte 
stringence signifie que les conditions de temperature et de 
force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de 1 1 hybridation entre deux 
5 fragments d'ADN compiementaires . 

A titre illustratif, des conditions de forte 
stringence de l f 6tape d' hybridation aux fins de definir les 
fragments polynucieot idiques deer its ci -dessus , sont 
avantageusement les suivantes : 

1' hybridation est r€alisee a une temperature 
pr6f4rentielle de 65°C, en presence de tampon commercialise 
sous le nom de rapid-hyb buffer par Amersham (RPN 1636) et 
100 ixg/ml d'ADN de E.coli. 

Les Stapes de lavage peuvent, par exemple, etre les 
suivantes : 

- deux lavages de 10 min, pref erentiellement a 65°C, dans 
un tampon 2 x SSC et 0,1% SDS; 

- deux lavages de 10 min, pref erentiellement a 65°C, dans 
un tampon 1 x SSC et 0,1% SDS; 

- un lavage de 10 min, pr6f erentiellement a 65°C, dans un 
tampon de 0,1 x SSC et 0,1% SDS. 

1 x SSC correspond a 0, 15 M NaCl et 0,05M citrate de 
Na et une solution de 1 x Denhardt correspond a 0,02% 
Ficoll, 0,02% de polyvinylpyrrolidone et 0,02% de serum 
albumine bovine. 
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Avantageusement, un fragment nuclSotidique rSpondant a 
la definition pr6cedente aura au moins 8 nucleotides, de 
30 preference au moins 12 nucleotides, et encore plus 
preferentiellement au moins 20 nucleotides consecutifs de 
lasequence dont il est issu. Les conditions d' hybridation 
de forte stringence decrites ci-avant pour un 
polynucleotide d'une taille d» environ 200 bases, seront 
adaptees par l'homme du metier pour des oligonucleotides de 
taille plus grande ou plus petite, selon 1 ■ enseignement de 
Sambrook et al., 1989. 



35 
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Pour les conditions de mise en oeuvre des enzymes de 
restriction dans le but d'obtenir des fragments 
nucieotidiques des polynucleotides selon 1" invention, on se 
5 r6f6rera avantageusement a l'ouvrage de Sambrook et al., 
1989. 



Avantageusement , un polynucleotide de 1 1 invention 
contiendra au moins une sequence comprenant 1 1 enchainement 
10 de nucleotides allant du nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ ID 
N° 1. 



La presente invention a pour objet un polynucleotide 
15 selon 1' invention, caracterise en ce que sa sequence 
nucieique hybride avec l'ADN de sequence de mycobacteries 
et preferentiellement avec l'ADN de sequence de 
mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis. 
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Le polynucleotide est code par une sequence 
polynucieotidique telle que decrite supra. 

La presente invention a egalement pour objet un 
polypeptide issu d'une mycobacterie, caracterise en ce 
qu'il est present uniquement chez les mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis. 

L' invention concerne egalement un polypeptide 
caracterise en ce qu'il comprend un polypeptide choisi 
parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N°l a SEQ ID N°24C, 
SEQ ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide def ini en a) , 
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c) un fragment d'au moins 5 acides amines d'un polypeptide 
d6f ini en a)ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 

5 

La prEsente invention a aussi pour objet un 
polypeptide dont la sequence d' acides amin6s est comprise 
dans la sequence d' acides amines SEQ ID N°l ou SEQ ID N°2, 
ou un polypeptide de sequence d' acides amines SEQ ID N°28. 

Par polypeptide homologue, on entendra d6signer les 
polypeptides presentant, par rapport au polypeptide naturel 
selon 1' invention tel que le polypeptide DP4 28, certaines 
modifications comme en particulier une d616tion, addition 

15 ou substitution d'au moins un acide aminS, une troncation, 
un allongement, une fusion chimErique, et/ou une mutation. 
Parmi les polypeptides homologues, on prEfere ceux dont la 
sequence d' acides amines present e au moins 30%, - de 
preference 50%, d'homologie avec les sequences d' acides 

20 amines des polypeptides selon 1* invention. Dans le cas 
d'une substitution, un ou plusieurs acides amines 
consecutifs ou non consecutifs, sont remplaces par des 
acides amines « equivalents ». L' expression acide amine 
« Equivalent » vise ici a designer tout acide amine 

25 susceptible d'etre substitue a l'un des acides amines de la 
structure de base sans cependant modifier essentiellement 
les propriEtEs immunogdnes des peptides correspondants . En 
d'autres termes, les acides amines Equivalents seront ceux 
qui permettent I'obtention d'un polypeptide de sequence 

30 modifiee qui permet I 1 induction in vivo d'anticorps ou de 
cellules capables de reconnaitre le polypeptide dont la 
sequence d 1 acides amines est comprise dans la sequence 
d' acides amines de polypeptide selon 1" invention, telle que 
les sequences d' acides amines SEQ ID N°l I SEQ ID N° 2, ou 
35 un polypeptide de sequence d' acides amines SEQ ID N°28 
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(polypeptide DP428) ou l'un de ses fragments ci-dessus 
d§f inis. 

Ces aminoacyles Equivalents peuvent etre determines 
soit en s'appuyant sur leur homologie de structure avec les 
5 aminoacyles auxquels lis se substituent, soit sur les 
r6sultats des essais d 1 immunog6nicit6 croisSe auxquels les 
diff brents peptides sont susceptibles de donner lieu. 

A titre d'exemple, on mentionnera les possibilit6s de 
10 substitutions susceptibles d'etre effectuSes sans qu'il en 
r6sulte une modification approf ondie de 1 ' immunogenicite 
des peptides modifies correspondants, les remplacements, 
par exemple, de la leucine par la valine ou 1 » isoleucine, 
de l'acide aspartique par l'acide glutamique, de la 
15 glutamine par 1 ' asparagine, de I'arginine par la lysine 
etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

Par fragment biologiquement act if , on entendra 
20 designer en particulier un fragment de sequence d' acides 
amines de polypeptide prfesentant au moins une des 
caracteristiques des polypeptides selon 1* invention, 
notamment en ce qu'il est : 

capable d'etre exports et/ou secrete par une 
25 mycobact§rie, et/ou d'etre induit ou reprime lors de 
l 1 infection par la mycobactSrie ; et/ou 

capable d'induire, de r§primer ou de moduler, 
directement ou indirectement , un facteur de virulence de 
mycobacterie ; et/ou 
30 - capable d'induire une reaction d' immunogenicite dirig^e 
centre les mycobacteries ; et/ou 

• capable d'etre reconnu par un anticorps specif ique de 
mycobacterie . 



Par fragment de polypeptide, on entend designer un 
polypeptide comportant au minimun 5 acides amines, de 
preference 10 acides amines et 15 acides amines. 
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Un polypeptide de 1' invention, ou un de ses 
fragments, tels que definis pr6cedemment , est susceptible 
d'etre reconnu specif iquement par les anticorps presents 
5 dans le sfirum de patients infect6s par des mycobactfiries et 
pr6f6rentiellement des bact6ries appartenant au complexe de 
Mycobacterium tuberculosis ou par des cellules de l'hote 
infects. 

Font ainsi partie de 1» invention les fragments du 

10 polypeptide dont la sequence d'acides amines est comprise 
dans la sequence d'acides amines de polypeptide selon 
1" invention, telle que les sequences d'acides amines SEQ ID 
N°l a SEQ ID N°2, ou un polypeptide de sequence d'acides 
amines SEQ ID N°28, qui peuvent etre obtenus par clivage 

15 dudit polypeptide par une enzyme proteolytique, telle que 
la trypsine ou la chymotrypsine ou la collagSnase, ou par 
un rSactif chimique, tel que le bromure de cyanogene (CNBr) 
ou encore en pla<?ant un polypeptide selon 1' invention tel 
que le polypeptide DP428 dans un environnement tr&s acide, 

20 par exemple Sl pH 2,5. Des fragments peptidiques prefires 
selon l 1 invention, pour une utilisation en diagnostic ou en 
vaccination, sont les fragments contenus dans des regions 
de polypeptide selon 1* invention tel que le polypeptide 
DP428 susceptibles d'etre naturellement exposfies au solvant 

25 et de presenter ainsi des propri6t6s d' immunoggnicite 
importante. De tels fragments peptidiques peuvent etre 
prfiparSs indif f 6remment par synthase chimique, a partir 
d'h6tes transform^ par un vecteur d' expression selon 
1' invention contenant un acide nucleique permettant 

30 1' expression desdits fragments, place sous le contr51e des 
Pigments de regulation et/ou d' expression appropriSs ou 
encore par clivage chimique ou enzymatique. 

Une analyse de 1 ' hydrophilicite du polypeptide DP428 a 
35 6te realisSe a l'aide du logiciel DNA Strider™ 
(commercialism par le CEA Saclay) , sur la base d'un calcul 
du caractere hydrophile de la region codante pour le DP428 
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de la SEQ ID N°28. Les rSsultats de cette analyse sont 
presentes a la figure 54, oQ sont detaill£s, pour chacun 
des acides amines (AA) de position d£finie dans la SEQ ID 
N°28, l'indice d' hydrophilicite . Plus l'indice 
5 d' hydrophilicite est 61ev6, plus I'acide amin6 consid<§re 
est susceptible d'etre expose au solvant dans la molecule 
native, et est en consequence susceptible de presenter un 
degr£ d» antigenicity eieve. Ainsi, un enchainement d'au 
moins sept acides amines possedant un indice eieve 
10 d' hydrophilicite (>0,3) peut const ituer la base de la 
structure d'un peptide candidat immunog^ne selon la 
presente invention. 

Les r^ponses immunitaires cellulaires de I'hote a un 
15 polypeptide selon 1' invention, peuvent etre mises en 
Evidence selon les techniques decrites par Colignon et al. f 
1996. 

D'apres les donnees de la carte d' hydrophilicite 
20 presentee 3 la Figure 54, les inventeurs ont pu definir des 
regions du polypeptide DP428 pref erent iellement exposees au 
solvant, plus particulierement la region localisee entre 
les acides amines 55 et 72 de la sequence SEQ ID N° 28 et 
la region localisee entre les acides amines 99 et 107 de la 
25 SEQ ID N° 28. 

Les regions peptidiques du polypeptide DP428 definies 
ci-dessus peuvent etre avantageusement mises en oeuvre pour 
la realisation des compositions immunogenes ou des 
30 compositions vaccinales selon 1' invention. 

Les polynucleotides caracterises en ce qu'ils codent 
pour un polypeptide selon 1' invention, font 6galement 
partie de 1' invention. 

35 

L' invention concerne egalement les sequences d'acide 
nucleique- utilisables comme sonde ou amorce, caracterisees 
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en ce que lesdites sequences sont choisies parmi les 
sequences d'acide nucieique de polynucleotides selon 
1 1 invention. 

5 L 1 invention concerne en outre 1 1 utilisation d'une 

sequence d'acide nucieique de polynucleotides selon 
1* invention comme sonde ou amorce, pour la detection et/ou 
1 Amplification de sequence d'acide nucieique. Parmi ces 
sequences d'acide nucieique selon 1' invention utilisables 

10 comme sonde ou amorce, on prefere les sequences d'acide 
nucieique de 1 1 invention, caractSrisee en ce que lesdites 
sequences sont des sequences, ou leur sequence 
complementaire, comprises entre le nucleotide en position 
nt 964 et le nucleotide en position nt 1234, extrSmites 

15 indues, de la sequence SEQ ID N°l. 

Parmi les polynucleotides selon 1' invention, 
utilisables comme amorces nucleotidiques, on prefere 
particulierement les polynucleotides de sequence SEQ ID 
20 N°25 et SEQ ID N°26. 

Les polynucleotides selon 1' invention peuvent ainsi 
etre utilises pour sSlectionner des amorces nucleotidiques, 
notamment pour la technique PCR (Erlich, 1989 ; Innis et 
25 al., 1990, et, Rolfs et al., 1991). 

Cette technique nScessite le choix de paires 
d 1 oligonucleotides encadrant le fragment qui doit etre 
amplifie. On peut, par exemple, se r£f£rer S la technique 

30 d£crite dans le brevet am£ricain U.S. N° 4 683 202. Ces 
amorces oligodesoxyribonucl£otidiques ou oligoribo- 
nucieotidiques ont avantageusement une longueur d*au moins 
8 nucleotides, de preference d'au moins 12 nucleotides, et 
encore plus pref erentiellement au moins 20 nucleotides. On 

35 preferera en particulier des amorces d'une longueur 
comprise entre 8 et 30 et de preference 12 et 22 
nucleotides. L 1 une des deux amorces est complement aires du 
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brin (+) [amorce aller] de la matrice et 1' autre amorce est 
complementaire du brin (-) [amorce retour] . II est 
important que les amorces ne possedent pas de structure 
secondaire ou de sequence complementaire l'une de 1' autre. 

5 D 1 autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de manidre £ ce que les amorces ne 
s'hybrident pas avec d'autres acides nuclSiques provenant 
de cellules procaryotes ou eucaryotes, en particulier avec 
les acides nucl6iques provenant d'autres mycobact6ries 

10 pathogSnes, ni avec 1 1 ADN ou 1 1 ARN humain pouvant 
eventuellernent contaminer 1 'echantillon biologique. 

Les resultats prSsentes a la figure 51, montrent que 
la sequence codant pour le polypeptide DP428 (SEQ ID N° 28) 
15 n'est pas retrouvSe dans les ADNs de M. fortui turn, M. 
simiae, M. avium, M. chelonae, M. flavescens, M. gordonae, 
M. marinum et M. kansasii 



Les fragments amplifies peuvent etre identifies apres 
20 une electrophorese en gel d 1 agarose ou de polyacrylamide, 
ou apres une electrophorese capillaire, ou encore apres une 
technique chromatographique (filtration sur gel, 
chromatographic hydrophobe ou chromatographic Schangeuse 
d'ions). La spScificite de 1 • amplification peut etre 
25 contrdlSe par hybridation molSculaire en utilisant comme 
sondes les sequences nucl§otidiques de polynucleotides de 
1' invention, des plasmides contenant ces sequences ou leurs 
produits d' amplification. 

30 Les fragments nucl6otidiques amplifies peuvent etre 

utilises comme rSactifs dans des reactions d* hybridation 
afin de mettre en Evidence la presence, dans un Schantillon 
biologique, d'un acide nuclfeique cible de sequence 
complementaire a celle desdits fragments nuclgotidiques 

35 amplifies. 
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Parmi les polynucleotides selon 1' invention, 
utilisables comme sondes nucleotidiques, on prefere tout 
particulierement le fragment polynucleotidique comprenant 
la sequence comprise entre le nucleotide en position nt 964 
5 et le nucleotide en position nt 1234, extremites indues, 
de la sequence de SEQ ID N°l. 

Ces sondes et amplicons peuvent etre marques ou non 
par des elements radioactifs ou par des molecules non 
10 radioactives, telles que des enzymes ou des elements 
f luorescents. . 

L' invention vise egalement les fragments 
nucleotidiques susceptibles d'etre obtenus par 

amplification a l'aide d' amorces selon 1' invention. 

D'autres techniques d' amplification de l'acide 
nucleique cible peuvent etre avantageusement employees 
comme alternatives a la PCR. 



15 
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La technique SDA (Strand Displacement Amplification) 
ou technique d' amplification a deplacement de brin (Walker 
et al., 1992) est une technique d' amplification isotherme 
dont le principe est fonde sur la capacite d'une enzyme de 
restriction de couper l'un des deux brins de son site de 
25 reconnaissance qui se trouve sous une forme 
hemiphosphorothioate et sur la propriety d'une ADN 
polymerase d'initier la synthese d'un nouveau brin d 1 ADN a 
partir de l'extremite 3 'OH creee par 1' enzyme de 
restriction et de deplacer le brin prealablement synthetise 
30 qui se trouve en aval. 

Les polynucleotides de 1' invention, en particulier les 
amorces selon 1' invention, peuvent egalement etre mis en 
oeuvre dans d'autres procedes d' amplification d'un acide 
nucleique cible, tels que : 
35 - la technique TAS (Transcription-based Amplification 
System), decrite par Kwoh et al . en 1989; 
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-la technique 3SR (Self -Sustained Sequence Replication), 
dScrite par Guatelli et al. en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification), decrite par Kievitis et al. en 1991; 
5 - la technique TMA (Transcription Mediated Amplification). 

Les polynucleotides de 1* invention peuvent aussi etre 
employes dans des techniques d •amplification ou de 
modification de I'acide nucl£ique servant de sonde, telles 
que : 

10 - la technique LCR (Ligase Chain Reaction) , decrite par 
Landegren et al . en 1988 et perf ectionnee par Barany et al . 
en 1991, qui emploie une ligase thermostable; 

- la technique de RCR (Repair Chain Reaction) , decrite par 
Segev en 1992; 

15 - la technique CPR (Cycling Probe Reaction) , decrite par 
Duck et al. en 1990; 

- la technique d' amplification a la Q-beta-replicase, 
decrite par Miele et al. en 1983 et perf ectionnee notamment 
par Chu et al. en 1986, Lizardi et al . en 1988, puis par 

20 Burg et al . ainsi que par Stone et al . en 1996. 

Dans le cas oQ le polynucleotide cible a d6tecter est 
un ARN, par exemple un ARNm, on utilisera avantageusement , 
pr£alablement a la mise en oeuvre d'une reaction 

25 d 1 amplification & l'aide des amorces selon I 1 invention ou a 
la mise en oeuvre d*un procede de detection a l'aide des 
sondes de 1' invention, une enzyme de type transcriptase 
inverse afin d'obtenir un ADNc a partir de 1 'ARN contenu 
dans l»6chantillon biologique. L 1 ADNc obtenu servira alors 

30 de cible pour les amorces ou les sondes mises en oeuvre 
dans le procede d 1 amplification ou de detection selon 
1' invention. 

La sonde de detection sera choisie de telle maniere a 
35 ce qu'elle hybride avec l'amplicon gSnere. Une telle sonde 
de detection aura avantageusement pour sequence une 
sequence d'au moins 12 nucleotides, en particulier d'au 
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moins 15 nucleotides, et de preference au moins de 200 
nucleotides . 

Les sondes nucleotidiques selon 1' invention sont 
capables de detecter des mycobacteries et 
preferentiellement des bacteries appartenant au complexe de 
Mycobacterium tuberculosis, plus precisement du fait que 
ces mycobacteries possedent dans leur genome au moins une 
copie de polynucleotides selon 1' invention. Ces sondes 
selon 1' invention, sont capables, par exemple, de 
s'hybrider avec la sequence nucleotidique d'un polypeptide 
selon 1' invention, plus particulierement tout 
oligonucleotide hybridant avec la sequence SEQ ID N°l 
codant pour le polypeptide DP428 de M. tuberculosis, et ne 
presentant pas de reaction d' hybridation croisee ou 
15 d' amplification (PCR) avec par exemple des sequences 
presentes chez des mycobacteries n • appartenant pas au 
complexe de Mycobacterium tuberculosis. Les sondes 
nucleotidiques selon 1' invention hybrident specif iquement 
avec une molecule d'ADN ou d'ARN de polynucleotide selon 
1' invention, dans des conditions d ' hybridation de forte 
stringence telles que donnees sous forme d* exemple 
precedemment . 



20 



25 



Les sequences non marquees peuvent §tre utilisees 
directement comme sondes, cependant les sequences sont 
generalement marquees par un Element radioactif ("p, M s, 
*H, " S I) ou par une molecule non -radioactive (biotine, 
acetylaminofluorene, digoxigenine , 5-bromo-desoxyuridine, 
fluoresceine) pour obtenir des sondes utilisables pour de 
30 nombreuses applications. 

Des exemples de marquages non radioactifs de sondes 
sont decrits, par exemple, dans le brevet francais N° 
78.10975 ou par Urdea et al. ou par Sanchez -Pescador et al. 
35 en 1988. 
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Dans ce dernier cas, on pourra aussi utiliser l'une 
des mSthodes de marquage decrites dans les brevets FR 2 422 
956 et FR 2 518 755. La technique d' hybridation peut etre 
realisee de manieres diverses (Matthews et al . , 1988). La 

5 methode la plus generale consiste a immobiliser l'acide 
nucleique extrait des cellules de mycobacteries sur un 
support (tel que nitrocellulose, nylon, polystyrene) et a 
incuber, dans des conditions bien definies, l'acide 
nucleique cible immobilis6 avec la sonde. Apres 

10 1' hybridation, l'exces de sonde est ^limine et les 
molecules hybrides formees sont detectees par la methode 
appropriee (mesure de la radioactivite, de la fluorescence 
ou de l'activite enzymatique liee & la sonde). 
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Avantageusement , les sondes nucleotidiques marquees 
selon 1' invention peuvent avoir une structure telle 
qu'elles rendent possible une amplification du signal 
radioactif ou non-radioactif . Un systeme d' amplification 
repondant a la definition ci-dessus comprendra des sondes 
de detection sous la forme d'un ADN ramifie, branche 
(♦branched DNA») telles que celles decrites par Urdea et 
al. en 1991. Selon cette technique, on utilisera avanta- 
geusement plusieurs types de sondes notamment une sonde de 
capture, afin d' immobiliser 1 'ADN ou l'ARN cible sur un 
25 support, et une sonde de detection. La sonde de detection 
lie un ADN «branche» presentant une structure ramifiee. 
L' ADN branche, a son tour, est capable de fixer des sondes 
oligonucleotidiques qui sont elles-memes couplees a des 
molecules de phosphatase alcaline. Puis l'activite de cette 
30 enzyme est mise en evidence grace a un substrat chimio- 
luminescent, par exemple un derive du dioxetane - phosphate . 

Selon un autre mode avantageux de mise en oeuvre des 
sondes nucleiques selon 1' invention, ces dernieres peuvent 
35 etre immobilisees sur un support, de maniere covalente ou 
non covalente, et utilises comme sondes de capture. Dans 
ce cas, une sonde, dite «sonde de capture*, est immobilisee 
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sur un support et sert a capturer par hybridation sp§ci- 
fique l'acide nucieique cible obtenu a partir de l'gchan- 
tillon biologique £ tester. Si n£cessaire, le support 
solide est s6par6 de 1 ' Schantillon et le duplex forme entre 
5 la sonde de capture et l'acide nucieique cible est ensuite 
d6tect6 grace a une seconde sonde, dite «sonde de 
detection*, marquee par un element facilement detectable. 

Les fragments oligonucieotidiques peuvent etre obtenus 
10 a partir des sequences selon l 1 invention, par coupure avec 
des enzymes de restriction, ou par synthese chimique selon 
les mSthodes classiques, par exemple selon la mSthode 
d6crite dans le brevet europeen N° EP-0305929 (Millipore 
Corporation) ou encore par d'autres procedes. 
15 Un mode ^ preparation approprie des acides nucleiques 

de 1" invention comportant au maximum 200 nucleotides (ou 
200 pb s'il s*agit decides nucleiques bicatSnaires) 
comprend les 6tapes suivantes : 

- la synthese d 1 ADN en utilisant la methode automatisee des 
20 beta-cyanethylphosphoramidite decrite en 1986, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 
par hybridation avec une sonde appropriee. 

Un mode de preparation, par voie chimique, d» acides 
25 nucleiques selon 1' invention de longueur superieure a 200 
nucleotides (ou 200 pb lorsqu'il s'agit d' acides nucleiques 
bicatenaires) comprend les etapes suivantes : 

- !• assemblage d' oligonucleotides synthetises chimiquement , 
pourvus a leur extremite de sites de restrictions 

30 differents, dont les sequences sont compatibles avec 
1 ' enchainement en acides amines du polypeptide naturel 
selon le principe decrit en 1983, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 

35 recherches par hybridation avec une sonde appropriee. 
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Les sondes nucleotidiques utilisees pour la 
recuperation des acides nucieiques recherch^s dans les 
proc6d6s sus-mentionnes, sont constitutes g6n6ralement de 8 
a 200 nucleotides de la sequence de polypeptide selon 
1' invention et sont susceptibles de s'hybrider avec l'acide 
nucleique recherche dans les conditions d ' hybridation 
dSfinies pr6c6demment . La synthase de ces sondes peut etre 
effectu6e selon la methode automat isee des beta 
cyanethylphosphoramidites dScrite en 1986. 



Les sondes oligonucleotidiques selon 1' invention 
peuvent etre mises en oeuvre au sein d'un dispositif de 
detection comprenant une banque matricielle 
d' oligonucleotides. Un exemple de realisation d'une telle 
15 banque matricielle peut consister en une matrice 
d' oligonucleotides sondes fixes sur un support, la sequence 
de chaque sonde d'une longueur donnee etant situee en 
decalage d'une ou plusieurs bases par rapport a la sonde 
precedente, chacune des sondes de 1 ' arrangement matriciel 
etant ainsi complementaire d'une sequence distincte de 
l'ADN ou l'ARN cible a detecter et chaque sonde de sequence 
connue etant fixee en une position predeterminee du 
support. La sequence cible a detecter peut etre 
avantageusement marquee radioactivement ou non 
25 radioactivement. Lorsque la sequence cible marquee est mise 
en contact avec le dispositif matriciel, celle-ci forme des 
hybrides avec les sondes de sequences compiementaires . Un 
traitement a la nuclease, suivi d'un lavage, permet 
d-eiiminer les hybrides sondes -sequence cible qui ne sont 
30 pas parfaitement compiementaires. Du fait de la 
connaissance precise de la sequence d'une sonde a une 
position determinee de la matrice, il est alors possible de 
deduire la sequence nucieotidique de la sequence d'ADN ou 
d'ARN cible. Cette technique est particulierement efficace 
35 lorsque sont utilisees des matrices de sondes 
oligonucleotidiques de grande taille. 
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Une alternative a 1 ' utilisation d'une sequence cible 
marquee peut consister en 1 ' utilisation d'un support 
permettant une detection « bio61ectronique » de 
1' hybridation de la sequence cible sur les sondes du 
support matrice, lorsque que ledit support est constitue ou 
comprend un materiau capable d'agir, par exemple, en tant 
que donneur d 'electrons aux positions de la matrice 
auxquelles un hybride a ete forme. Un tel materiau donneur 
d' electron est par exemple de l'or. La detection de la 
sequence nucleotidique de l'ADN ou ARN cible est alors 
determinee par un dispositif electronique . 



Un exemple de realisation d'un biocapteur, tel que 
defini ci-dessus, est decrit dans la demande de brevet 
europeen N° EP-0721 016 au nom de Affymax technologies N.V. 
ou encore dans le brevet americain N° US 5.202.231 au nom 
de Drmanac. 

L- invention a aussi pour objet les polynucleotides 
hybrides resultant : 

- soit de la formation d'une molecule hybride entre un ARN 
ou un ADN (ADN genomique ou ADNc) provenant d'un 
echantillon biologique avec une sonde ou une amorce selon 
1 ' invention. 

- soit de la formation d'une molecule hybride entre un ARN 
25 ou un ADN (ADN genomique ou ADNc) provenant d'un 

echantillon biologique avec un fragment nucleotidique 
amplifie a l'aide d'un couple d' amorces selon 1' invention. 

Par ADNc au sens de la presente invention, on entend 
une molecule d'ADN obtenue en faisant agir une enzyme de 
type transcriptase inverse sur une molecule d' ARN, en 
particulier une molecule d'ARN messager (ARNm) , selon les 
techniques decites dans Sambrook et al . en 1989. 

La presente invention a egalement pour objet une 
famille de plasmides recombinants, caracterises en ce 
qu'ils contiennent au moins une sequence nucleotidique de 
polynucleotide selon 1' invention. Selon un mode de 
realisation avantageux dudit plasmide, il comprend la 
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sequence nucleotidique SEQ ID N°l ou un fragment de celle- 
ci . 

Un autre objet de la presente invention est un vecteur 
pour le clonage,l 'expression et/ou 1' insertion d'une 

5 sequence, caracterise en ce qu'il comprend une sequence 
nucleotidique de polynucleotide selon 1' invention en un 
site non essentiel pour sa replication, le cas echeant sous 
le controle d' elements de regulation susceptibles 
d'intervenir dans l'expression du polypeptide DP428, chez 

10 un h6te determine. 

Des vecteurs particuliers sont par exemple des 
plasmides, des phages, des cosmides, des phagemides, des 
YAC. 

Ces vecteurs sont utiles pour transformer des cellules 
15 hdtes afin de doner ou d'exprimer les sequences 
nucleotidiques de 1' invention. 

L' invention comprend egalement les cellules notes 
transformees par un vecteur selon 1' invention. 



20 
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35 



De preference, les cellules notes sont transformees 
dans des conditions permettant l'expression d'un 
polypeptide recombinant selon 1' invention. 



Une cellules note preferee selon 1- invention est la 
souche E. coli transformee par le plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°I-1818 ou transformee 
par le plasmide pMlC25 depose le 4 aoQt 1998 a la CNCM sous 
le n«> 1-2062 ou une mycobacterie appartenant a une souche 
30 de M. tuberculosis, M.bovia ou M.africanum possedant 
potentiellement tous les systemes de regulation appropries. 

II est aujourd'hui facile de produire des proteines ou 
polypeptides en quantite relativement importante par genie 
genetique en utilisant comme vecteurs d' expression des 
plasmides, des phages, des phagemides. Tout ou partie du 
gene DP428, ou tout polynucleotide selon 1" invention, peut 
§tre insere dans un vecteur d' expression approprie pour 
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produire in vitro un polypeptide selon 1' invention, 
notamment le polypeptide DP428. Ledit polypeptide pourra 
etre fixe sur une microplaque pour developper un test 
s6rologique destine a rechercher, dans un but de 
5 diagnostic, les anticorps sp^cifiques chez les patients 
atteints de tuberculose. 

Ainsi, la pr£sente invention concerne un precede de 
preparation d'un polypeptide, caract6ris6 en ce qu'il met 
10 en oeuvre un vecteur selon 1" invention. Plus 
particulierement 1« invention concerne un procedfi de 
preparation d'un polypeptide de 1' invention comprenant les 
etapes suivantes : 

- le cas ech6ant, 1 1 amplification pr^alable suivant la 

15 technique PCR de la quantite de sequences de nucleotides 
codant pour ledit polypeptide a l'aide de deux amorces 
d'ADN choisies de maniere a ce que l'une de ces amorces 
soit identique aux 10 & 25 premiers nucleotides de la 
sequence nucleotidique codant pour ledit polypeptide, 

20 tandis que 1" autre amorce est complementaire des 10 a 25 
derniers nucleotides (ou s'hybride avec ces 10 a 25 
derniers nucleotides) de ladite sequence nucleotidique, ou 
inversement de maniere a ce que l'une de ces amorces soit 
identique aux 10 a 25 derniers nucleotides de ladite 

25 sequence, tandis que 1" autre amorce est complementaire des 
10 a 25 premiers nucleotides (ou s'hybride avec les 10 a 25 
premiers nucleotides) de ladite sequence nucleotidique, 
suivie de 1 ■ introduction desdites sequences ainsi 
amplifiees dans un vecteur approprie, 

30 - la mise en culture, dans un milieu de culture approprie, 
d'un h6te cellulaire prealablement transforme par un 
vecteur approprie contenant un acide nucieique selon 
1' invention comprenant la sequence nucleotidique codant 
pour ledit polypeptide, et 

35 - la separation, a partir du susdit milieu de culture, 
dudit polypeptide produit par ledit h6te cellulaire 
transforme. 
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L 1 invention a aussi pour objet un polypeptide 
susceptible d'etre obtenu par un proc§d6 de 1" invention tel 
que decrit pr6c6demment . 

Les peptides selon 1' invention peuvent Sgalement etre 
pr6par6s par les techniques classiques, dans le domaine de 
la synthese des peptides. Cette synthese peut etre rSalisSe 
en solution homog£ne ou en phase solide. 

Par exemple, on aura recours a la technique de 
synthese en solution homogene decrite par Houbenweyl en 
1974. 



Cette methode de synthese consiste a condenser 
successivement deux-a-deux les aminoacyles successifs dans 
15 l'ordre requis, ou a condenser des aminoacyles et des 
fragments prSalablement formes et contenant d6ja plusieurs 
aminoacyles dans l'ordre approprie, ou encore plusieurs 
fragments prSalablement ainsi prepares, etant entendu que 
l'on aura eu soin de proteger au prealable toutes les 
fonctions reactives portees par ces aminoacyles ou 
fragments, 3 1' exception des fonctions amines de l'un et 
carboxyles de 1' autre ou vice -versa, qui doivent 
normalement intervenir dans la formation des liaisons 
peptidiques, notamment apres activation de la fonction 
carboxyle, selon les mSthodes bien connues dans la synthese 
des peptides. En variante, on pourra avoir recours a des 
reactions de couplage mettant en jeu des reactifs de 
couplage classique, du type carbodiimide, tels que par 
exemple la l-6thyl-3- (3 -dimethyl -aminopropyl) -carbodiimide . 

Lorsque l'aminoacyle mis en oeuvre poss&de une 
fonction acide supplementaire (notamment dans le cas de 
l 1 acide glutamique) , ces fonctions seront protegees, par 
exemple par des groupes t-butylester . 

Dans le cas de la synthese progressive, acide amine 
par acide aminS, la synthese debute de preference par la 
condensation de 1 1 amino-acide C- terminal avec I'aminoacide 
qui correspond a l f aminoacyle voisin dans la sequence 
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desiree et ainsi de suite, de proche en proche, jusqu'a 
l'acide amine N-terminal. 

Selon une autre technique preferee de 1» invention, on 
a recours a celle decrite par Merrifield. 

Pour fabriquer une chaine peptidique selon le procede 
de Merrifield, on a recours a une resine polymere tres 
poreuse, sur laquelle on fixe le premier acide amine C- 
terminal de la chaine. Cet acide amin6 est fixe sur la 
resine par 1 • interm6diaire de son groupe carboxylique et sa 
fonction amine est protegee, par exemple par le groupe t- 
butyloxycarbonyle . 

Lorsque le premier acide amine C-terminal est ainsi 
fixe sur la resine, on enleve le groupe protecteur de la 
fonction amine en lavant la resine avec un acide. 



Dans le cas ou le groupe protecteur de la fonction 
amine est le groupe t-butyloxycarbonyle, il peut etre 
elimine par traitement de la resine a l'aide d' acide 
20 trif luordacetique . 

On couple ensuite le deuxieme acide amine qui fournit 
le second aminoacyle de la sequence recherchee, a partir du 
residu aminoacyle C-terminal sur la fonction amine 
25. deprotegee du premier acide amine C-terminal fixe sur la 
chaine. De preference, la fonction carboxyle de ce deuxieme 
acide amine est activee, par exemple par la 
dicyclohexylcarbodiimide, et la fonction amine est 
protegee, par exemple par le t-butyloxycarbonyle. 

On obtient ainsi la premiere partie de la chaine 
peptidique recherchee, qui comporte deux acides amines, et 
dont la fonction amine terminale est protegee. Comme 
precedemment, on deprotege la fonction amine et on peut 
ensuite proceder a la fixation du troisieme aminoacyle, 
dans des conditions analogues a celles de 1' addition du 
deuxieme acide amine C-terminal. 
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On fixe ainsi, les uns apres les autres, les acides 
amines qui vont constituer la chaine peptidique sur le 
groupe amine chaque fois deprotege au prealable de la 
portion de la chaine peptidique deja formee, et qui est 
rattachee a la resine. 

Lorsque la totalite de la chaine peptidique desiree 
est formee, on eliraine les groupes protecteurs des 
differents acides amines constituant la chaine peptidique 
et on dStache le peptide de la resine. par exemple a l'aide 
d'acide f luorhydrique . 



De maniere preferentielle, lesdits polypeptides 
susceptibles d'etre obtenus par un procede de 1' invention 
tel que decrit precedemment comprendront une region exposee 
IS au solvant et auront une longueur d'au moins 20 acides 
amines . 

Selon un autre mode de realisation de 1' invention, 
lesdits polypeptides sont specifiques de mycobacteries du 
complexe Wycobacterium tuberculosis et ne sont done pas 

reconnus par des anticorps specifiques d' autres proteines 
de mycobacteries. 

L' invention est en outre relative a des polypeptides 
25 hybrides presentant au moins un polypeptide selon 
1' invention et une sequence d'un polypeptide susceptible 
d'induire une reponse immunitaire chez l'homme ou 1' animal. 

Avantageusement, le determinant antigenique est tel 
qu'il est susceptible d'induire une reponse humorale et/ou 
30 cellulaire. 

Un tel determinant pourra comprendre un polypeptide 
selon 1' invention sous forme glycosylee utilise en vue 
d'obtenir des compositions immunogenes susceptibles 
35 d'induire la synthese d'anticorps diriges centre des 
Epitopes multiples. Lesdits polypeptides glycosyles font 
egalement partie de 1' invention. 
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Ces molecules hybrides peuvent etre constitutes en 
partie d'une molecule porteuse de polypeptide selon 
1' invention associee a une partie, en particulier un 
epitope de la toxine diphterique, la toxine tetanique, un 
5 antigene de surface du virus de 1- hepatite B (brevet FR 79 
21811), l'antigene VP1 du virus de la poliomyelite ou toute 
autre toxine ou antigene viral ou bacterien. 

Avantageusement, ledit determinant antigenique 
10 correspond a un determinant antigenique de proteines 
immunogenes de 45/47 kD de M. tuberculosis (demande 
internationale PCT/FR 96/0166), ou encore selectionnees par 
exemple parmi ESAT6 (Harboe et al . , i 9 96, Andersen et al . , 
1995, et Sorensen et al . , 1995) et DES (PCT/FR 97/00923 ', 
15 Gicquel et al. ) 

Un antigene viral, tel que defini ci-dessus, sera 
preferentiellement une proteine de surface ou d'enveloppe 
d'un virus de 1- hepatite, par exemple la proteine de 
surface de 1- hepatite B sous l'une de ses formes S, S- 
preSl, S-preS2 ou S-preS2-preSl ou encore une proteine d'un 
virus de 1 -hepatite A, ou d'une hepatite non-A, non-B, tel 
qu'un virus de 1' hepatite C, E ou delta. 

25 Plus particulierement, un antigene viral tel que 

defini ci-dessus sera tout ou partie de l'une des 
glycoproteines codees par le genome du virus HIV-l (brevets 
GB 8324800, EP 84401834 ou EP 85905513) ou du virus H1V-2 
(EP 87400151), et en particulier tout ou partie d'une 

30 proteine select ionnee parmi gag, pol, nef ou env de HIV-l 
ou de HIV-2. 

Les procedes de synthese des molecules hybrides 
englobent les methodes utilisees en genie genetique pour 
35 construire des polynucleotides hybrides codant pour les 
sequences polypeptidiques recherchees. On pourra, par 
exemple, se referer avantageusement a la technique 
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d'obtention de genes codant pour des proteines de fusion 
decrite par Minton en 1984 . 

Lesdits polynucleotides hybrides codant pour un 
polypeptide hybride ainsi que les polypeptides hybrides 
selon 1' invention caracterises en ce qu'il s'agit de 
proteines recombinantes obtenues par 1 'expression desdits 
polynucleotides hybrides, font egalement partie de 
1' invent ion. 

Les polypeptides selon 1 - invention peuvent 
avantageusement etre mis en oeuvre dans un procede pour la 
detection in vitro d'anticorps diriges centre lesdits 
polypeptides, notamment le polypeptide DP428, et ainsi 
d'anticorps diriges contre une bacterie du complexe 
Mycobacterium tuberculosis, dans un echantillon biologique 
(tissu ou fluide biologique) susceptible de les contenir, 
ce procede comprenant la mise en contact de cet echantillon 
biologique avec un polypeptide selon 1' invention dans des 
conditions permettant une reaction immunologique in vitro 
entre ledit polypeptide et les anticorps eventuellement 
presents dans 1 ' echantillon biologique, et la mise en 
evidence in vitro des complexes ant igene- anticorps 
eventuellement formes. 



Les polypeptides selon 1' invention peuvent egalement 
et avantageusement etre mis en oeuvre dans un procede pour 
la detection d'une infection par une bacterie du complexe 
Mycobacterium tuberculosis dans un mammifere base sur la 

30 detection in vitro d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire, la synthese 
de proteines telles que 1' interferon gamma. Ce procede pour 
la detection d'une infection par une bacterie du complexe 

35 Mycobacterium tuberculosis dans un mammifere, est 
caracterise en ce qu'il comprend les etapes suivantes : 
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a) preparation d'un echantillon biologique contenant des 
cellules dudit mammi fere plus particulierement des cellules 
du systeme immunitaire dudit mammi fere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 ' echantillon biologique de l'etape a) 
avec un polypeptide selon 1' invention; 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire et/ou la 
synthese de proteines telles que 1 • interferon gamma. 

La proliferation cellulaire pourra etre mesuree, par 
exemple par incorporation de 'H-Thymidine . 

Font egalement partie de 1' invention, les procedes de 
detection d'une reaction d'hypersensibilite retardee (DTH) , 
caracterises en ce qu'ils mettent en oeuvre un polypeptide 
selon 1 » invention . 

De preference, 1 ' echantillon biologique est constitue 
par un fluide, par exemple un serum humain ou animal, du 
sang, des biopsies, le liquide broncho-alveolaire ou le 
liquide pleural. 



Toute procedure classique peut etre mise en oeuvre 
25 pour realiser une telle detection. 

A titre d'exemple, une methode preferee met en jeu des 
processus immunoenzymatiques selon la technique ELISA. par 
immunofluorescence, ou radio- immunologique (ria)' ou 
30 equivalent. 

Ainsi, 1' invention concerne egalement les polypeptides 
selon 1' invention, marques a l'aide d'un marqueur adequat 
tel que du type enzymatique, fluorescent, radioactif. 
35 De telles methodes comprennent par exemple les etapes 

suivantes : 
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- depdt de quantities determines d'une composition 
polypeptidique selon 1' invention dans les puits d'une 
plaque de microtitration, 

- introduction dans lesdits puits de dilutions croissantes 
de serum, ou d' echantillon biologique autre tel que defini 
precedemment , devant Stre analyst, 

- incubation de la microplaque, 

- introduction dans les puits de la plaque de 
microtitration d'anticorps marques diriges contre des 
immunoglobulines humaines ou animales, le marquage de ces 
anticorps ayant ete realise a l'aide d'une enzyme 
selectionnee parmi celles qui sont capables d'hydrolyser un 
substrat en modifiant 1' absorption des radiations de ce 
dernier, au moins a une longueur d'onde determinee, par 

15 exemple a 550 nm, 

- detection, en comparaison avec un temoin de controle, de 
la quantite de substrat hydrolyse. 
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L' invention concerne egalement un necessaire ou kit 
pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis, comprenant : 

- un polypeptide selon 1' invention. 

- le cas echeant les reactifs pour la constitution du 
milieu propice a la reaction immunologique ou specifique, 

- les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique 
eventuellement presents dans 1 ' echantillon biologique, et 
la mise en evidence in vitro des complexes antigene- 

30 anticorps eventuellement formes, ces reactifs pouvant 
egalement porter un marqueur, ou etre susceptibles d'Stre 
reconnus a leur tour par un react if marque. plus 
, particulierement dans le cas ou le polypeptide selon 
1' invention n'est pas marque, 

- le cas echeant, un echantillon biologique de reference 
(temoin n4gatif) depourvu d'anticorps reconnus par un 
polypeptide selon 1' invention, 
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- le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantite predetermine 
d- anticorps reconnus par un polypeptide selon 1' invention. 

Les polypeptides selon 1' invention permettent de 
preparer des anticorps monoclonaux ou polyclonaux 
caracterises en ce qu'ils reconnaissent specif iquement les 
polypeptides selon 1- invention. Les anticorps monoclonaux 
pourront avantageusement etre prepares a partir 
d'hybridomes selon la technique decrite par Kohler et 
Milstein en 1975. Les anticorps polyclonaux pourront etre 
prepares, par exemple par immunisation d'un animal en 
particulier une souris, avec un polypeptide selon 
1' invention associe a un adjuvant de la reponse 
xmmunitaire, puis purification des anticorps specif iques 
contenus dans le serum des animaux immunises sur une 
colonne d'af finite sur laquelle a prealablement ete fixe le 
polypeptide ayant servi d'antigene. Les anticorps 
polyclonaux selon 1- invention peuvent aussi etre prepares 
par purification sur une colonne d'af finite, sur laquelle a 
prealablement ete immobilise un polypeptide selon 
1' invention, des anticorps contenus dans le serum de 
patients infectes par une mycobacterie et 
preferentiellement une bacterie appartenant au complexe 
Mycobacterium tuberculosis. 



L' invention a egalement pour objet des anticorps mono 
ou polyclonaux ou leurs fragments, ou anticorps 
30 chimeriques, caracterises en ce qu'ils sont capables de 
reconnaltre specif iquement un polypeptide selon 
1' invention. 

Les anticorps de 1' invention pourront egalement etre 
35 marques de la meme maniere que decrit precedemment pour les 
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sondes nucleiques de 1' invention tel qu'un marquage de type 
enzymatique, fluorescent ou radioactif. 

L' invention viae en outre un precede pour la detection 
specifique de la presence d'un antigene d'une mycobacterie 
et preferentiellement un bacterie du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caract6rise en 
ce qu'il comprend les Stapes suivantes : 

a) Mise en contact de 1 • echantillon biologique (tissu ou 
fluide biologique) prSleve chez un individu avec un 
anticorps mono ou polyclonal selon 1- invention , dans des 
conditions permettant une reaction immunologique in vitro 
entre lesdits anticorps et les polypeptides specifiques des 
mycobacteries et preferentiellement des bacteries du 
complexe de Mycobacterium tuberculosis eventuellement 
presents dans 1 ' echantillon biologique, et 

b) Mise en evidence du complexe antigene -anticorps forme\ 

Entre egalement dans le cadre de 1' invention, un 
necessaire ou kit pour le diagnostic in vitro sur un 
Echantillon biologique, de la presence de souches de 
mycobacteries des mycobacteries et preferentiellement des 
bacteries appartenant au complexe de Mycobacterium 
tuberculosis, "de preference M. tuberculosis, caracterise en 
ce qu'il comprend : 

- un anticorps polyclonal ou monoclonal selon 1- invention, 
le cas echSant marqu6; 

- le cas echeant, un reactif pour la constitution du milieu 
propice a la realisation de la reaction immunologique; 

- un reactif permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique, 
ce reactif pouvant egalement porter un marqueur, ou §tre 
susceptible d'etre reconnu a son tour par un reactif 
marquS, plus particulierement dans le cas ou ledit 
anticorps monoclonal ou polyclonal n'est pas marque. 
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- le caa echeant, des reactifs pour effectuer la ly Se des 
cellules de 1 ' echantillon teste. 

La presente invention a egalement pour objet un 
5 precede de detection et d- identification rapide des 
mycobacteries et pref erentiellement des bacteries de M. 
tuberculosis dans un echantillon biologique, caracterise 
en ce qu'il comporte les etapes suivantes : 

a) Isolement de 1 'AON a partir de 1 ' echantillon 
10 biologique a analyser, ou obtention d'un ADNc a partir de 

l'ARN del' echantillon biologique ; 

b) Amplification specif ique de l'ADN des mycobacteries et 
prfiferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis a 1'aide d' amorces selon 

15 1' invention; 

c) Analyse des produits d' amplification. 

Le produits d' amplification peuvent etre analyses par 
differentes methodes. 

20 Deux methodes d' analyse sont donnees a titre d'exemple 

ci-dessous : 

- Analyse electrophoretique en gel d' agarose des 
produits d- amplification. La presence d-un fragment d'ADN 
migrant a l'endroit attendu suggere que 1 • echantillon 
analyse contenait de 1 'AON de mycobacteries appartenant au 
complexe tuberculosis, ou 

- Analyse par la technique d' hybridation moleculaire 
en utilisant une sonde nucleique selon 1- invention. Cette 
sonde sera avantageusement marquee par un element non 
radioactif (sonde froide) ou radioactif. 

Aux fins de la presente invention, on entendra par 
« AON de 1- echantillon biologique » ou « ADN contenu dans 
1' echantillon biologique », soit l'ADN present dans 
1 echantillon biologique considere, soit l'ADNc obtenu 
apres 1-action d'une enzyme de type transcriptase inverse 
sur 1'arn present dans ledit echantillon biologique. 
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Un autre precede de la presente invention permet la 
detection d'une infection par une mycobacterie et 
5 preferentiellement une bacterie du complexe Mycobacterium 
tuberculosis dans un mammifere. Ce precede comprend les 
Stapes suivantes : 

a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 

10 du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 -echantillon biologique de l'etape a) avec 
un polypeptide selon 1 • invention; 

Odetection d'une reaction cellulaire indiquant une 
15 sensibilisation prealable du mammifere audit polypeptide 
notamment la proliferation cellulaire et/ou la synthese de 
proteines telles que 1' interferon gamma; 

d) detection d'une reaction d' hypersensibilite retardee ou 
de sensibilisation du mammifere audit polypeptide. 

20 

Cette methode de detection est une methode 
intradermique, qui est decrite par exemple par M. J. Elhay 
et al. (1988) Infection and Immunity, 66(7) : 3454-3456. 

*5 Un autre but de la presente invention consiste en un 

procede pour la detection des mycobacteries et 
preferentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis dans un echantillon biologique, 
caracterise en ce qu'il comprend les etapes suivantes : 

30 a) Mise en contact d'une sonde oligonucleotidique selon 
1' invention avec un echantillon biologique, l'ADN contenu 
dans l'echantillon biologique, ou l'ADNc obtenu par 
transcription inverse de l'ARN de l'echantillon biologique, 
ayant, le cas 6cheant, prealablement ete rendu accessible a 

35 1' hybridation, dans des conditions permettant 1 • hybridation 
de la sonde a l'ADN ou l'ADNc des mycobacteries et 
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prSfSrentiellement des bactSries du complexe Mycobacterium 
tuberculosis ; 

b) Detection de l'hybride forme entre la sonde 
oligonucleotidique et l'ADN de 1 'echantillon biologique. 

L' invention vise egalement un procede pour la detection 
des mycobacteries et preferentiellement des bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 
echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
1' invention immobilisee sur un support. avec un 
echantillon biologique, l'ADN de 1 ' Schantillon biologique 
ayant, le cas echeant, ete prealablement rendu accessible a 
1' hybridation, dans des conditions permettant 1' hybridation 
de ladite sonde a l'ADN des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

b) Mise en contact de l'hybride forme entre ladite sonde 
oligonucleotidique immobilisee sur un support et l'ADN 
contenu dans 1 • echantillon biologique. le cas echeant apres 
elimination de l'ADN de 1 'echantillon biologique n'ayant 
pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon 1' invention. 

Selon un mode de realisation avantageux du procSde de 
detection defini precedemment . celui-ci est caracterise en 
ce que. prealablement a l'etape a), l'ADN de 1 'echantillon 
biologique est prealablement amplifie a l'aide d'un couple 
d' amorces selon 1' invention. 



Une autre forme de mise en oeuvre du procede de 

detection selon 1 ■ invention consiste en un procede pour la 

detection de la presence des mycobacteries et 

35 preferentiellement des bacteries appartenant au complexe de 
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Mycobacterium tuberculosis dans un echantillon biologique, 
caracterise en ce qu'il comprend les etapes suivantes : 

a) Mise en contact de 1 ' echantillon biologique avec un 
couple d-amorces selon 1' invention, 1-ADN contenu dans 
1 Echantillon ayant ete, le cas echeant, prealablement 
rendu accessible a 1 -hybridation, dans des conditions 
permettant une hybridation desdites amorces a l'ADN des 
mycobacteries et preferentiellement des bacteries du 
complexe Mycobacterium tuberculosis; 

b) Amplification de l'ADN d-une mycobacterie et 
preferentiellement d-une bacterie du complexe Mycobacterium 
tuberculosis; 

O mise en evidence de 1 'amplification de fragments d - ADN 
correspondant au fragment encadre par les amorces, par 
exemple par electrophorese sur gel ou au moyen d-une sonde 
oligonucleotidique selon invention. 

L- invention a aussi pour objet un procede pour la 
detection de la presence des mycobacteries et 
preferentiellement des bacteries appartenant au complexe de 
Mycobacterium tuberculosis dans un echantillon biologique 
par deplacement de brin, caracterise en ce qu-il comprend 
les etapes suivantes : 

a) Mise en contact de 1 -echantillon biologique avec deux 
couples d-amorces selon 1-invention specif iquement 
destinees a 1' amplification de type SDA decrites ci-dessus, 
l'ADN contenu dans 1 -echantillon ayant ete, le cas echeant! 
prealablement rendu accessible a 1- hybridation, dans des 
conditions permettant une hybridation des amorces a 1 - ADN 
des mycobacteries et preferentiellement des bacteries du 
complexe Mycobacterium tuberculosis; 
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b) amplification de 1 'AON des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

c) mise en evidence de 1 'amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par 
exemple par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon 1' invention. 

L' invention concerne aussi un necessaire ou kit pour 
la mise en oeuvre du precede decrit ci-dessus, destine a la 
detection de la presence des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique selon 1- invention; 

b) Les reactifs necessaires a la mise en oeuvre d'une 
reaction d' hybridation ,- 

c) Le cas echeant, un couple d'amorces selon 1- invention 
ainsi que les reactifs necessaires a une reaction 
d- amplification de 1 'ADN (ADN genomique, ADN plasmidique ou 
ADNc) des mycobacteries et preferentiellement des bacteries 
du complexe Mycobacterium tuberculosis. 

L' invention a aussi pour objet un kit ou necessaire 
pour la detection de la presence des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique, dite sonde de capture, 
30 selon 1' invention; 

b) Une sonde oligonucleotidique, dite . sonde de 
revelation, selon 1 ' invention . 

c) Le cas echeant, un couple d'amorces selon 1' invention 
ainsi que les reactifs necessaires a une reaction 

35 d' amplification ' de 1 'ADN des mycobacteries et 
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preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis. 

L' invention concerne encore un kit ou necessaire pour 
5 1' amplification de 1 ' ADN des mycobacteries et 
preferentiellement des bacteries du complexe Mycobacterium 
tuberculosis present dans un echantillon biologique, 
caracterise en ce qu'il comprend les elements suivants : 

l» a) Un couple d' amorces selon 1' invention; 

b) Les reactifs necessaires pour effectuer une reaction 
d' amplification d 1 ADN; 

c) Eventuellement un composant permettant de v6rifier la 
sequence du fragment amplify, pi us particulierement une 

15 sonde oligonucleotidique selon 1' invention. 

Un autre objet de la presente invention concerne une 
composition immunogene, caracterisee en ce qu'elle comprend 
un polypeptide selon 1' invention. 

!0 

Une autre composition immunogene selon 1- invention est 
caracterise en ce qu'elle comprend un ou plusieurs 
polypeptides selon 1' invention et/ou un ou plusieurs 
polypeptides hybrides selon 1' invention. 

:5 

Selon un mode de realisation avantageux, la 
composition immunogene ci-dessus definie est constitutive 
d'un vaccin, lorsqu'elle est presentee en association avec 
un vehicule pharmaceutiquement acceptable et eventuellement 
i0 un ou plusieurs adjuvants de l'immunite tels que l'alun ou 
un representant de la famille des muramyl peptides ou 
encore 1' adjuvant incomplet de Freund. 

Aujourd'hui, divers types de vaccins sont disponibles 
(5 pour proteger l'homme centre des maladies infectieuses : 
micro-organismes vivants attenues (M. bovis - BCG pour la 
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tuberculose) , micro-organismes inactive (virus de la 
grippe), des extraits acellulaires (Bordetella pertussis 
pour la coqueluche), prolines recombinees (antigene de 
surface du virus de 1' hepatite B) , des polyosides 
(pneumocoques) . Des vaccins prepares a partir de peptides 
de synthase ou de micro-organismes genetiquement modifies 
exprimant des antigenes heterologues sont en cours 
d- experimentation. Plus recemment encore, des adn 
plasmidiques recombines portant des genes codant pour des 
antigenes protecteurs ont ete proposes comme strategie 
vaccmale alternative. Ce type de vaccination est realise 
avec un plastnide particulier derivant d'un plasmide de E. 
coli qui ne se replique pas in vivo et qui code 
uniquement pour la proteine vaccinante. Les principaux 
composants fonctionnels de ce plasmide sont : un promoteur 
fort permettant 1 ' expression dans les cellules eucaryotes 
(par exemple celui du CMV) , un site de clonage approprie 
pour inserer le gene d'interet, une sequence de 
terminaison-polyadenylation, une origine de replication 
procaryote pour produire le plasmide recombine in vitro 
et un marqueur de selection (par exemple le gene de 
resistance a 1 • ampicilline) pour faciliter la selection 
des bacteries qui contiennent le plasmide. Des animaux ont 
ete immunises en injectant simplement 1 'ADN plasmidique nu 
dans le muscle. Cette technique conduit a 1' expression de 
la proteine vaccinale in situ e t a une reponse 
immunitaire en particulier de type cellulaire (CTL) et de 
type humoral (anticorps) . Cette double induction de la 
reponse immunitaire est l'un des principaux avantages de 
la technique de vaccination avec de 1 'ADN nu. Huygen et 
al. (1996) et Tascon et al . (1996) ont reussi a obtenir 
une certaine protection centre M. tuberculosis en 
injectant des plasmides recombines contenant des genes de 
M. leprae (hsp65, 36kDa pra ) comme inserts. M. leprae 
est l'agent responsable de la lepre. L'utilisation d'un 
xnsert specifique de Af. tuberculosis comme par exempli 
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tout ou partie du gene DP428, objet de la presente 
invention conduirait probablement a une meilleure 
protection contre la tuberculose. Tout ou partie du gene 
DP428, ou tout polynucleotide selon 1- invention, peut etre 
5 facilement insere dans les plasmides vecteurs VU 
(Montgomery et al, 1993), p C DNA3 (Invitrogen, R & D 
Systems) ou pcDNAl/Neo (Invitrogen) qui possedent les 
caracteristiques necessaires pour une utilisation 
vaccinale. 

10 

L- invention vise ainsi un vaccin, caracterisee en ce 
qu-il comprend un ou plusieurs polypeptides selon 
1- invention et/ou un ou plusieurs polypeptides hybrides 
selon 1- invention tels que precedemment definis en 
15 association avec un vehicule pharmaceutiquement compatible 
et, le cas echeant, un ou plusieurs adjuvants de 
1 ' immunite appropries . 

L- invention vise aussi une composition vaccinale 
20 destinee a 1 ' immunisation de 1 • homme ou 1' animal a 
l'encontre d'une infection bacterienne ou virale, telle que 
la tuberculose ou 1-hepatite, caracterisee en ce qu'elle 
comprend un ou plusieurs polypeptides hybrides tels que 
precedemment definis en association avec un vehicule 
25 pharmaceutiquement compatible et, le cas echeant, un ou 
plusieurs adjuvants de 1' immunite. 

Avantageusement, dans le cas d'une proteine hybride 
entre un polypeptide selon 1' invention et l'antigene de 

30 surface de 1 'hepatite B, la composition vaccinale sera 
administree, chez 1- homme, a raison de 0,1 a l Mg de 
proteine hybride purifiee par kilogramme du poids du 
patient, de preference 0,2 a 0,5 M g/kg de poids du patient, 
pour une dose destinee a une administration donnee. Dans le 

35 cas de patients atteints de troubles du systeme 
immunitaire, en particulier les patients immunodeprimes, 
chaque dose injectee contiendra pref erentiellement la 
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moxtie de la quantite ponderale de la proteine hybride 
contenue dans une dose destinee a un patient n'etant pas 
affects de troubles du systeme immunitaire. 

De preference, la composition vaccinale sera 
administree a plusieurs reprises, de maniere 6talee dans le 
temps, par voie intradermique ou sous-cutanee . A titre 
d'exemple, trois doses telles que definies ci-dessus seront 
respectivement administrees au patient au temps to, au 
temps to + l mois et au temps to + l an. 

Alternativement, trois doses seront respectivement 
administrees au patient au temps to, au temps to + i mo is 
et au temps to + 6 mois. 

15 Chez la souris, chez laquelle une dose ponderale de la 

composition vaccinale comparable a la dose utilisee chez 
l'homme est administree, la reaction anticorps est testee 
par prelevement du serum suivi d'une etude de la formation 
d'un complexe entre les anticorps presents dans le serum et 

20 l'antigene de la composition vaccinale, selon les 
techniques usuelles. 

L' invention concerne egalement une composition 
immunogene caracterisee en ce qu 'elle comprend un 
25 polynucleotide ou un vecteur d- expression selon 
1' invention, en association avec un vehicule permettant son 
administration a l'homme ou 1' animal. 
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L' invention a encore pour objet un vaccin destinS a 
1 • immunisation a l'encontre d'une infection bacterienne ou 
vxrale, telle que la tuberculose ou 1' hepatite, caracterise 
en ce qu'il comprend un polynucleotide ou un vecteur 
d- expression selon 1- invention, en association avec un 
vehicule pharmaceutiquement acceptable. 

De telles compositions immunogenes ou vaccinales sont 
notamment. decrites dans la demande Internationale N« wo 



WO 99/09186 



PCT/FR98/01813 



61 



10 



90/11092 (Vical Inc.) et egalement dans la demande 
Internationale N° wo 95/11307 (Institut Pasteur) . 

Le polynucleotide constitutif de la composition 
immunogene ou de la composition vaccinale selon 1- invention 
peut etre injecte a l'hote apres avoir ete couple a des 
composes qui favorisent la penetration de ce polynucleotide 
a l'interieur de la cellule ou son transport jusqu'au noyau 
cellulaire. Les conjugues resultants peuvent etre 
encapsules dans des microparticules polymeres, comme decrit 
dans la demande Internationale N° WO 94/27238 (medisorb 
Technologies International) . 

Selon un autre mode de realisation de la composition 
15 immunogene et/ou vaccinale selon 1- invention, le 
polynucleotide, de preference un AON, est complexe avec du 
DEAE-dextran (Pagano et al . , 1967) ou avec des prolines 
nucleaires (Kaneda et al., 1989), avec des lipides (Feigner 
et al., 1987) ou encore encapsules dans des liposomes 
20 (Fraley et al., 1980). 
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Selon encore un autre mode de realisation avantageux 
de la composition immunogene et/ou vaccinale selon 
1' invention, le polynucleotide selon 1- invention peut etre 
introduit sous la forme d'un gel facilitant sa transfection 
dans les cellules. Une telle composition sous forme de gel 
peut etre un complexe de poly-L-lysine et de lactose, comme 
decrit par Midoux en 1993, ou encore le Poloxamer 407™, 
comme decrit par Pastore en 1994. Le polynucleotide ou le 
vecteur selon 1- invention peuvent aussi etre en suspension 
dans une solution tampon ou etre associes a des liposomes. 

Avantageusement, un tel vaccin sera prepare 
conformement a la technique decrite par Tacson et al. ou 
Huygen et al. en 1996 ou encore conformement a la technique 
d6crite par Davis et al. dans la demande Internationale N« 
WO 95/11307 (Whalen et al . ) . 
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Un 



tel vaccin sera avantageusement prSparS sous la 
forme d'une composition contenant un vecteur selon 
l'invention, plac6e sous le controle d'€16ments de 
regulation permettant son expression chez l'homme ou 
5 1' animal. 

Pour realiser un tel vaccin, le polynucleotide selon 
l'invention est tout d'abord sous-clone dans un vecteur 
depression approprie, plus particulierement un vecteur 
d' expression contenant des signaux de regulation et 
d' expression reconnus par les enzymes des cellules 
eucaryotes et contenant 6galement une origine de 
replication active chez les procaryotes, par exemple chez 
B. coli, qui permet son amplification prealable. Puis le 
plasmide recombinant purifie obtenu est injecte a l'hdte, 
par exemple par voie intramusculaire . 

On pourra par exemple utiliser, en tant que vecteur 
d' expression in vivo de l'antigene d'interet, le plasmide 
PCDNA3 ou le plasmide pcDNAl/neo, tous l es deux 
commercialises par Invitrogen (R&D Systems, Abingdon. 
Royaume-Uni) . On peut aussi utiliser le plasmide VUns.tPA! 
decrit par Shiver et al. en 1995. 

Un tel vaccin comprendra avantageusement, outre le 
vecteur recombinant, une solution saline, par exemple une 
25 solution de chlorure de sodium. 

Une composition vaccinale telle que definie ci-dessus sera 
par exemple administree par voie parenteral ou par voie 
intramusculaire. 



La presente invention concerne egalement un vaccin 
caracterise en ce qu'il contient une ou plusieurs sequences 
nucleotidiques selon l'invention et/ou un ou plusieurs 
polynucleotides tel que mentionne ci-dessus en association 
avec un vehicule pharmaceutiquement compatible et, le cas 
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echeant, un ou plusieurs adjuvants de 1 • immunity 
appropries . 

Un autre aspect porte sur une methode de criblage de 
molecules capables d-inhiber la croissance de mycobacteries 
ou le maintien de mycobacteries dans un h6te, caracterisee 
en ce que lesdites molecules bloquent la synthese ou la 
fonction des polypeptides codes par une sequence 
nucleotidique selon 1- invention ou par un polynucleotide 
tel que decrit supra. 

Dans ladite methode de criblage, les molecules peuvent 
etre des anti-messagers ou peuvent induire la synthese 
d'anti-messagers . 



La presente invention vise egalement des molecules 
capables d'inhiber la croissance de mycobacteries ou le 
maintien de mycobacteries dans un note, caracterisees en ce 
que lesdites molecules sont synthetisees d'apres la 
20 structure des polypeptides codes par une sequence 
nucleotidique selon !• invention ou par un polynucleotide 
tel que decrit supra. 

D'autres caracteristiques et avantages de 1- invention 
25 apparaissent dans les exemples et les figures suivants : 



FIGURES 



30 



La serie de Figure ^ 



La serie de Figures 1 illustre la serie de sequences 
nucleotidiques SEQ ID N«»l correspondant a 1 • insert du 
vecteur pDP428 (depose a la CNCM sous le N» 1-1818) et 
35 la serie de sequences d'acides amines SEQ ID N'l des 
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polypeptides codes par la serie des sequences 
nucleotidiques SEQ ID N°l. 

Figure 2 ; 

Illustre la sequence nucleotidique SEQ id N°2 
correspondant a la region incluant le gene codant pour 
le polypeptide DP428 (region soulignee) . Sur cette 
figure ont ete pris en compte a la fois les codons ATG 
et GTG d' initiation de la traduction. La figure fait 
apparaitre que le polypeptide DP428 fait probablement 
partie d'un op6ron comprenant au moins trois genes. La 
region doublement encadree inclut probablement les 
regions promotrices . 

La region simplement encadree correspond au motif LPISG 
rapellant le motif LPXTG decrit chez les bacteries a 
Gram positifs comme permettant 1 • ancrage aux 
peptidoglycannes. 

La seri e de Figures 3 

La serie de Figures 3 represente la serie de sequences 
nucleotidiques SEQ ID N°3 correspondant a 1 ' insert du 
vecteur p6D7 (depose a la CNCM sous le N° 1-1814) . 

La s6r le de Figures 4 : 

La serie de Figures 4 represente la serie de sequences 
nucleotidiques SEQ ID N<»4 correspondant a 1 ' insert du 
vecteur p5A3 (depose a la CNCM sous le N° 1-1815. 

La serie de Figure ^ . 

La serie de Figures 5 represente la serie de sequences 
nucleotidiques SEQ ID N«»5 correspondant a 1 ' insert du 
vecteur p5F6 (depose a la CNCM sous le N» 1-1816) 
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La serie de Figures 6 ; 

La serie de Figures 6 represente la serie de sequences 
nucleotidiques SEQ ID N°6 correspondant a 1 ' insert du 
vecteur p2A29 (depose a la CNCM sous le N° 1-1817). 

La serie dt» Fiaurea 7 • 

La serie de Figures 7 represente la serie de sequences 
nucleotidiques SEQ ID N°7 correspondant a 1 ' insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819) . 

La serie H e Fiaurea fl • 

La serie de Figures 8 represente serie de sequences 
nucleotidiques SEQ ID N<>8 correspondant a 1 ' insert du 
vecteur plC7 (depose a la CNCM sous le N« 1-1820). 

La serie H P r^,r- 0 o a . 

La serie de Figures 9 represente la serie de sequences 
nucleotidiques SEQ ID N«9 correspondant a 1 • insert du 
vecteur p2D7 (depose a la CNCM sous le N° 1-1821) . 

La s6jri§ Fiaurea i p . 

La serie de Figures 10 represente la serie de sequences 
nucleotidiques SEQ ID N<»10 correspondant a 1 ' insert du 
vecteur plB7 (deposS a la CNCM sous le N° 1-1843) . 

30 La s£rif> de Fiaurea n . 

La serie de Figures 11 represente la serie de sequences 
nucleotidiques SEQ ID N°ll. 
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La seri e de Figures 12 
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La serie de Figures 12 represente la serie de sequences 
nucleotidiques SEQ ID N°12. 

La sgrie d e Figures n , 

5 

La serie de Figures 13 represente la serie de sequences 
nucleotidiques SEQ ID N°13. 

La serifi d^ Figure 14 ; 

to 

La serie de Figures 14 represente la serie de sequences 
nucleotidiques SEQ ID N°14 correspondant a 1 ■ insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819) 



15 



La serie de Figures 15 t 

La serie de Figures 15 represente la serie de sequences 
20 nucleotidiques SEQ ID N°15. 

La s6rjg d e Figures ]jj - 

La s^rie de Figures 16 represente la serie de sequences 
25 nucleotidiques SEQ ID N°16. 

La serie Figure*? 17 .. 

La serie de Figures 17 represente la serie de sequences 
30 nucleotidiques SEQ ID N°17. 

La serie Pjgures 1ft . 

La serie de Figures 18 represente la serie de sequences 
35 nucleotidiques SEQ ID N°18. 



La seri e de Figures 19 
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La serie de Figures 19 represente la serie de sequences 
nucleotidiques SEQ ID N°19. 

5 La serie de Figu res 20 ; 

La serie de Figures 20 represente la serie de sequences 
nucleotidiques SEQ ID N«»20 correspondant a 1 • insert du 
vecteur p2A29 (depose a la CNCM sous le N° 1-1817). 
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La serie de Fianr^ ->i . 

La serie de Figures 21 represente la serie de sequences 
nucleotidiques SEQ ID N°2l. 

La sgri e de Figures 22 ; 

La serie de Figures 22 represente la serie de sequences 
nucleotidiques SEQ ID N°22. 

La seri e de Figures 23 : 

La serie de Figures 23 represente la serie de sequences 
nucleotidiques SEQ ID N°23. 

La sSri e de Figures 24 : 

La serie de Figures 24 represente la serie de sequences 
nucleotidiques SEQ ID N°24. 



Figures ^ og . 

Les figures 25 et 26 illustrent respectivement les 
sequences SEQ ID N°25 et SEQ ID N«>26 repr6sentant un 
couple d' amorces utilisees pour amplifier 
35 specifiquement par PCR la region correspondant aux 
nucleotides 964 a 1234 inclus dans la sequence SEQ ID 
N°l. 
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La s£ri e de Figures 27 2 

La s£rie de Figures 27 represente la s^rie de sequences 
nuclSotidiques SEQ ID N<>27 correspondant a 1 • insert du 
vecteur p5A3. 

Figure 2fl : 

La sequence decides amines telle que definie dans la 
figure 28 represente la sequence d'acides amines SEQ ID 
N°28 correspondant au polypeptide DP428. 



15 Figure 29 



La figure 29 represente la sequence nucleotidique SEQ ID N° 
29 du gene complet codant pour la proteine M1C25. 

20 Figure 3 0 : 

La figure 30 represente la sequence d'acides amines SEQ ID 
N° 30 de la protSine M1C25. 

25 La seri e de Figures 31 ; 

La serie de Figures 31 represente la serie de sequences 
nucieotidiques SEQ id N°31. 

30 L a serie de Figures i*> ; 

La serie de Figures 32 represente la serie de sequences 
nucieotidiques SEQ ID N°32. 



35 La seri e de Figures 33 
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La sSrie de Figures 33 represent e la serie de sequences 
nucleotidiques SEQ ID N°33. 

La sgrifi H*> Figures 14 ■ 

La s6rie de Figures 32 represente la s^rie de sequences 
nucleotidiques SEQ ID N°34. 

La serifi r\<* f igures ^ ; 

10 

La serie de Figures 35 represente la serie de sequences 
nucleotidiques SEQ IDN°35. 



*5 

La s£ri e de Figures 36 : 

La serie de Figures 36 represente la serie de sequences 
nucleotidiques SEQ ID N°36. 

20 

La serie H e Fiaurps 17 ■ 

La serie de Figures 37 represente la serie de sequences 
nucleotidiques SEQ ID N°37. 

25 

La s£rie de Figures 38 ; 

La serie de Figures 38 represente la serie de sequences 
nucleotidiques SEQ ID N°38. 

30 

La s£rie Figurea 1Q . 



La serie de Figures 39 represente la serie de sequences 
nucleotidiques SEQ ID N°39. 

35 

La serie de Figures 40 ? 
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La serie de Figures 40 represente la serie de sequences 
nucleotidiques SEQ ID N°40. 

La serie de Fionirpg ai . 

5 

La serie de Figures 41 represente la serie de sequences 
nucleotidiques SEQ ID N°41 correspondant a 1 ' insert du 
vecteur p2D7 (depose a la CNCM sous le N°I-1821) . 

10 La serie de Fiatir- ? Q 4 0 . 

La serie de Figures 42 represente la serie de sequences 
nucleotidiques SEQ ID N°42. 



15 



La serie Hp Figures 41 . 

La s€rie de Figures 43 represente la serie de sequences 
20 nucleotidiques SEQ ID N°43. 

La seri e de Figures 44 - 

La serie de Figures 44 represente la serie de sequences 
25 nucleotidiques SEQ ID N°44 . 

La serie Hp Ejgurgg s 

La serie de Figures 45 represente la serie de sequences 
30 nucleotidiques SEQ ID N°45. 

L3 serie de Figures a* . 

La serie de Figures 46 represente la serie de sequences 
35 nucleotidiques SEQ ID N°46. 



La serie de Fig ures 47 
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La serie de Figures 47 represente la serie de sequences 
nucleotidiques SEQ ID N°47. 



5 La serie de Fjguxgs 4fl • 

La serie de Figures 48 represente la serie de sequences 
nucleotidiques SEQ ID N«>48. 

10 La s6rie de Figures 4 9 ; 

La serie de Figures 49 represente la serie de sequences 
nucleotidiques SEQ ID N°49. 



La ser ie de Figures SO • 

La serie de Figures 50 represente la serie de sequences 
nucleotidiques SEQ ID N°50. 

Figure 51 : 

A. la construction pJVED: Plasmid navette ( pouvant se 
multiplier chez les mycobacteries ainsi que chez 
E.coli). avec un gdne de resistance a la kanamycine 
(issu de Tn903) comme marqueur de selection. Le gene 
phoA tronque(A phoA) et le gene luc ferment un operon 
synthetique. 

B. Sequence de la jonction entre phoA et luc. 
Figure Si s 



Hybridation genomique (Southern blot) de 1 • ADN 
genomique de differentes especes mycobacteriennes a 
35 1-aide d'une sonde oligonucleotidique dont la sequence 
est la sequence comprise entre le nucleotide en 
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position nt 964 (extremity 5- de la sonde) et le 
nucleotide en position nt 1234 (extremity 3- de la 
sonde), extremity indues, de la sequence SEQ id h-i. 

5 Figures 53 et 54 : 

Activity Luc et PhoA de M. s.neg.acis recombinant 
contenant le pJVED avec differents fragments 
nucleotidiques comme decrits en exemple. Les figures 52 
■« et S3 representee ies resultats obtenus pour deux 
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experiences distinctes realisees dans les 
conditions. 



memes 



Figure 55 : 

Representation de 1 ■ hydrophobic^ (Kyte et Doolitle) 
de la sequence codante du polypeptide DP428 avec sa 
representation schematique. Le motif LPISG precede 
immediatement la region C-terminale hydrophobe. La 
sequence se termine par deux arginines. 

Figure Sfi : 

Representation de 1 • hydrophoicite (Kyte et Doolitle) de 
la sequence du polypeptide M1C25 de sequence d'acides 
amines SEQ ID N° 30. 

Figure «p ■ 



A- Gel d'acrylamide (12%) en condition denaturante d'un 
extrait bacterien obtenu par sonication de bacteries E. 
coli M15 contenant le plasmide P M1C25 sans et apres 4 
heures d'induction par 1-iptg, colore au bleu de 
35 Comassie. 
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ligne 1: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards High Range BIO-RAD(fi>). 

ligne 2: Extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide P M1C25 
sans induction par l'IPTG. 

ligne 3: Extrait bacterien obtenu par. sonication de 
bacteries E. coli MIS contenant le plasmide P M1C25 
apres 4 heures d' induction par l'IPTG. 

ligne 4: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards Low Range BIO-RAD®) . 

B- Western blot d'un gel semblable gel (acrylamide 12%) 
revele grace a l'anticorps penta-His commercialise par la 
soci6t§ Quiagen. 

20 ligne 1: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards High Range »IO-RAIXg>). 

ligne 2:extrait bacterien obtenu par sonication de 
bacteries E. coli Mis contenant le plasmide P M1C25 
25 sans induction par l'IPTG. 

ligne 3 .-extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide P M1C25 
apres 4 heures d' induction par l'IPTG. 
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ligne 4: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards Low Range BIO-RAD®) 

La bande presente tres majoritairement dans les lignes 
35 correspondant aux bacteries induites par l'IPTG par rapport 
* celles-non induites par l'IPTG, comprise entre 34200 et 
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28400 daltons, correspond a 1 'expression de 1 • insert M1C25 
clone dans le vecteur pQE-60 (Qiagen®) . 



En ce qui concerne les legendes des autres figures qui 
sont numerotees par un caractere alphanumerique, chacune de 
ces autres figures represente la sequence nucleotidique et 
la sequence d'acides amines de sequence SEQ id dont la 
numeration est identique au caractere alphanumerique de 
chacune desdites figures. 

Les numerations alphanumeriques des figures 
representant les SEQ ID comportant un nombre suivi d'une 
lettre ont les significations suivantes : 

- les numerations alphanumeriques presentant le meme 
nombre concernent une meme famille de sequence rattachees a 
la sequence de reference SEQ id dont la numeration 
pr6sente ce meme nombre et la lettre A 

- les lettres A, B et C pour une meme famille de sequences 
dxstinguent les trois phases de lecture possibles de la 
sequence nucleotidique SEQ ID de reference (A) ; 

- les lettres indexees par un prime (•) signified que la 
sequence correspond a un fragment de la sequence SEQ ID de 
reference (A) ; 

- la lettre D signifie que la sequence correspond a la 
25 sequence du gene predit par Cole et al . , 1998 ; 

- la lettre F signifie que la sequence correspond a la 
Phase ouverte de lecture (ORF pour "Open Reading Frame") 
contenant la sequence »D» correspondante d'apres Cole et 
al., 1998 ; 

30 - la lettre G signifie que la sequence est une sequence 
predite par Cole et al., 1998, et presentant une homologie 
de plus de 70% avec la sequence SEQ ID de reference (A) • 

- la lettre H signifie que la sequence correspond a ' la 
phase ouverte de lecture contenant la sequence .'G" 
correspondante d'apr&s Cole et al., 1998 ; 

- la lettre R signifie que la sequence correspond a une 
sequence predite par Cole et al., 1998, en amont de la 
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sequence - D - correspondante et pouvant etre en phase avec 
la sequence »D« en raison d-erreurs de s£quen 9 age 
possibles ; 

- la lettre P signifie que la s6quence correspond a la 
phase ouverte de lecture contenant la sequence «R» 
correspondante ; 

- la lettre Q signifie que la sequence correspond a une 
sequence contenant les sequences «f« et » P » 
correspondantes . 

En ce qui concerne la famille de sequences SEQ id n« 
4, 1' insert prec6dent phoA contient deux fragments non 
contigus sur le genome, SEQ ID 4 J et SEQ ID 4A, et done 
issus d'un clonage multiple permettant 1 'expression et 
1' exportation de phoA. Ces deux fragments non contigus, les 
genes et les phases ouvertes de lecture qui les contiennent 
d'apres Cole et al . , 1998, son t importants pour 
1 ' exportation d'un polypeptide antigene : 

- les lettres J, K et L distinguent les trois phases de 
lecture possibles de la sequence nucleotidique "j* 
correspondante ; 

- la lettre M signifie que la sequence correspond a la 
sequence predite par Cole et al., 1998, et contenant la 
sequence SEQ ID N° 4J ; 

- la lettre N signifie que la sequence correspond a la 
phase ouverte de lecture contenant la sequence SEQ ID N«> 

En ce qui concerne la famille de sequences SEQ ID 
N» 45, la lettre Z signifie que la sequence correspond a la 
sequence d'un fragment clone fusionne avec phoA. 

Enfin, en ce qui concerne la famille de sequence SEQ 
ID N» 41, la lettre S signifie que la sequence correspond a 
une sequence predite par Cole et al . , 1998 et pouvant etre 
dans la meme phase de lecture que la sequence ''D» 
correspondante, la lettre T signifiant que la sequence 
correspondante contient les sequences »p« et »s« 
correspondantes . 
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EXEMPLES 

Materiel et methodes 



Cultures bacteriennes, plasmides et milieux de cultures 

E. coli a ete cultive sur milieu liquide ou solide Luria- 
Bertani (LB). M. smegmatis a ete cultive sur milieu liquide 
Middlebrook 7H9 (Difco, additionne de dextrose albumine 
(ADC,. 0,2 % de glycerol et 0,05 % de Tween, ou sur milieu 
solade L. Si necessaire, 1 'antibiotique kanamycine a ete 
rajoute a une concentration de 20 M g/ml- 1. Les clones 
bacterxens presentant une activite PhoA ont ete detectes 
sur de 1'agar LB contenant du 5-bromo-4 -chloro-3-indolyle 
phosphate (X-P, a 40 /ig/ml- 1). 

Manipulation d'ADN et sequencage 

Les manipulations d'ADN et les analyses par 
20 Southern blot ont ete effectuees en utilisant les 
techniques standard (Sambrook et al . , 1989). Les sequences 
d'ADN double brun ont ete determines avec un kit de 
sequencage Tag Dye Deoxy Terminator Cycle (Applied 
Biosystems), dans un Systeme 9600 GeneAmp PGR (Perkin- 
25 Elmer), et apres migration sur un systeme d' analyse ADN 
modele 373 (Applied Biosystems) . 

Constructions des plasmides 



35 



Le plasmide pJVED a a ete construit a partir de 
PLA71, plasmide de transfert comportant le gene phoA 
tronque et place en phase avec BlaF. pLA7l a ete coupe avec 
les enzymes de restriction Kpnl et Wotl, retirant ainsi 
PhoA sans toucher le promoteur de BlaF. Le gene luc codant 
pour la luciferase de luciole a ete amplify a partir de 
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pGEM-luc et un site de liaison du ribosome a ete rajoute. 
phoA a ete amplifie a partir de pJEMll. Les fragments 
amplifies ont ete coupes avec PstI et ligatures ensemble. 
Les oligodeoxynucleotides utilises sont les suivants • 
pPV.luc.Fw : 5 ' GACTGCTGCAGAAGGAGAAGATCCAAATGG3 1 
luc.Bw : 5 ' GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 1 
pJEM.phoA.Fw : 5 ' CCGCGGATCCGGATACGTAC3 ' 
phoA . Bw : 5 ' GACTGCTGCAGTTTATTTCAGCCCCAGAGCG3 ' . 

Le fragment ainsi obtenu a ete reamplifiS en 
utilisant les oligonucleotides complementaires de ses 
extremites, coupe avec Kpnl et AfotI, et integre dans P LA71 
coupe avec les memes enzymes. La construction resultante a 
ete electroporee dans E. coli DHSa et M. s megma tis m C 2 155. 
Un clone M. smegmatis emettant de la lumiere et presentant 
une activite phoA a ete selectionne et appele pJVED/blaF. 
L' insert a ete retire en utilisant BamHl et la construction 
refermee sur elle-meme, reconstruisant ainsi le pJVED a 
Afin d'obtenir le pJVED b , c , l e multisite de clonage a ete 
coupe avec Seal et Kpnl et referme en enlevant un (pJVED b ) 
ou deux (pJVEDc) nucleotides du site SnaBI . Apres fusion 
six cadres de lecture ont pu ainsi etre obtenus. L 1 insert 
du pJVED/hspl* a ete obtenu par amplification en chaine par 
polymerase (ACP) de pPM1745 (Servant et al., 1995, en 
utilisant des oligonucleotides de la sequence : 
18 . Fw : 5 • GTACCAGTACTGATCACCCGTCTCCCGCAC3 ' 
18. Back : AGTCAGGTACCTCGCGGAAGGGGTCAGTGCG3 1 

Le produit a ete coupe avec Kpnl et Seal, et 
ligature a pJVED a , coupe avec les memes enzymes, quittant 
ainsi le pJVED/hsplS. 

Le P JVED/P19xDa et le pJVED/erp furent construits en 
coupant. avec BainHI !• insert de P Exp410 et pE xp53 
respectivement, et en les inserant dans le site BamR! du 
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multisite de clonage de pJVED a . 
Mesure de l'activite phosphatase alkaline 

La presence d'activite est detectee par la couleur 
bleue des colonies croissant sur un milieu de culture 
contenant le substrat 5-bromo 4-chloro 3-indolyl phosphate 
(XP), puis l'activite peut etre mesuree quantitativement de 
maniere plus precise de la facon suivante : 

M. smegwatis ont ete cultives dans un milieu LB 
additionnes de 0,05 % de Tween 80 (Aldrich) et de 
kanamycine (20 M g/ml- 1, * 3 7»C pendant 24 heures 
L'activite de la phosphatase alkaline a ete mesuree par la 
methode de Brockman et Heppel (Brockman et al . , 1968) dans 
un extrait sonique, avec p-nitrophenylphosphate comme 
substrat de la reaction. La quantite de proteines a ete 
mesuree par essai Bio-Rad. L'activite phosphatase alkaline 
est exprimee en unite arbitraire (densite optique a 420 nm 
x Mg de proteines- 1 x minutes- 1) . 

Mesure de l'activite lucif erase 
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M. smegmatis a ete cultive dans un milieu LB 
additionne de 0,05 % de Tween 80 (Aldrich) et de kanamycine 
(20 M g/ml- 1) a 37° C pendant 24 heures et utilise en pleine 
croxssance exponentielle (DO a 600 nm comprise entre 0,3 et 
0,8). Les aliquots de suspensions bacteriennes ont ete 
brievement soniques et 1- extrait cellulaire a ete utilise 
pour mesurer l'activite de la lucif erase. 25 M l de 
1' extrait sonique ont ete melanges avec 100 M l de substrat 
(systeme d'essai luciferase Promega, automat iquement dans 
un luminometre et la lumiere emise exprimee en ULR ou RLU 
(Unites Lumineuses Relatives). Les bacteries ont ete 
comptees par dilutions serielles de la suspension d'origine 
sur milieu agar LB kanamycine et l'activite de la 
luciferase exprimee en ULR/ M g de proteines bacteriennes ou 
en ULR/103 bacteries. 
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Construction de banques gSnomiques de M. tuberculosis et 
de M. bovis-BCG 



Les banques ont ete obtenues en utilisant 
essentxellement pJVED a , b , c precedemment decrits. 

Preparation de macrophages issus de la moelle osseuse et 
infection par M. smegmatis recombinants 



Les macrophages issus de la moelle osseuse ont ete 
prepares comme decrits par Lang et al., 1991. En resume, 
les cellules de la moelle osseuse ont ete preleves du femur 
de souris C57BL/6 agee de 6 a 12 semaines (Iffa-Credo, 

15 France). Les cellules en suspensions ont ete lavees et 
resuspendues dans du DMEM enrichi avec 10 % de serum foetal 
de veau, 10 % de milieu L-cell conditionne et 2 mM de 
glutamine, sans antibiotiques . 10 6 cellules ont ete 
ensemencees sur des plaques 24 puits Costar a fond plat 

20 dans i ml. A pres quatre jourg a 3?oc dang une atmogph ^ re 
humxde a 10 % de teneur en C02, les macrophages ont ete 
rxnc^s et reincubes pendant deux a quatre jours 
supplemental^ . Les cellules d'un puits controle ont ete 
lysees avec du triton x 100 a 0,1 % dans 1-eau et les 

25 noyaux enumer6s. Environ 5 x l 0 5 ce li u l es adh6rentes ont 
ete comptees. Pour !• infection, M. smegmatis portant les 
differents plasmides a ete cultive en pleine phase 
exponentielle (DO 600 nm entre 0,4 et 0,8) et dilue jusqu-a 
une DO de 0,1 puis 10 fois dans un milieu pour macrophage. 

30 1 ml a ete ajoute a chaque puits et les plaques ont ete 
centrxfugees et incubees quatre heures a 37»C. Apres trois 
lavages, l es celluleg ont ^ ±W ^ B dana un miUeu 
contenant de l'amykacine pendant deux heures. Apres trois 
nouveaux lavages, les cellules infectees adherentes ont ete 
xncubees dans un milieu macrophage pendant une nuit. Les 
cellules ont ensuite ete lysees dans 0,5 ml de tampon de 
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lyse (Promega) . 100 „1 ont ete soniques et la lumiere emise 
a ete mesuree sur 25 „m. Simultanement, les bacteries ont 
ete enumerees par etalement sur L-agar-kanamycine (20 
Mg/ml- 1). La lumiere emise est exprimee en ULR/l 0 3 
5 bacteries . 

Analyses des banques de donnees 



10 



15 



Les sequences nucleotidiques ont ete comparees a 
EMBL et GenBank en utilisant l'algorithme FASTA et les 
sequences proteiques ont ete analysees par similitude 
grace aux banques de donnees PIR et Swiss Prot en utilisant 
l'algorithme BLAST . 



Example 1 : Les vecteurs pJVED 



Les vecteurs pJVED (Figure 51) sont des plasmides 
portant un gene phoA tronque de E. coli depourvu de codon 
d- initiation, de sequence signal et de sequence 

20 regulatrice. Le site multiple de clonage (SMC) permet 
1' insertion de fragments des genes codants pour 
d'eventuelles prolines exportees ainsi que leurs sequences 
de regulation. Des lors, la proteine de fusion peut etre 
produite et presenter une activite phosphatase alcaline si 

25 elle est exportee. Seules les fusions en phase pourront 
etre product ives. Ainsi, le SMC a ete modifie de sorte que 
les fusions peuvent etre obtenues dans six phases de 
lecture. En aval de phoA, le gene luc de la lucif erase de 
luciole a ete insere. Le gene complet avec le codon 

30 d-initxation mais sans qu'aucun promoteur n'ait ete utilise 
devrait ainsi s'exprimer avec phoA comme dans un operon 
synthetique. Un nouveau site de liaison des ribosomes a ete 
insere huit nucleotides en amont du codon d' initiation de 
luc. Deux terminateurs transcriptionnels sont presents dans 

35 les vecteurs pJVED, un en amont du SMC et un second en aval 
de luc. ces vecteurs sont des plasmides de transfert E. 
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coli-mycobacterium avec un gSne de resistance a la 
kanamycine comme marqueur de selection. 

phoA et luc fonctionnent comme dans un operon, „,ais 
5 1' exportation est nScessaire pour 1 'activi te" phoA. 

Quatre plasmides ont ete construits par insertion 
dans le SMC de fragments d'ADN d'origine diverse : 

Dans la premiere construction nommee pJVED/biaF, le 
fragment de 1,4 kb provient du plasmide deja decrit pLAli 
•0 (Lim et al., l 995 ) . Ce fragment issu du gene P -lactamase 
(blaF) de M. fortuitum D216 (Timm et al . , 1994) inclut le 
promoteur mute hyperactif, le segment codant pour 32 acides 
amines de la sequence signal et les 5 premiers acides 
amxnes de la proteine mature. Ainsi cette construction 

ITT ^/ r ° m0teUr 16 P 1US fo " connu chez mycobacterium 
et les elements necessaires a 1 • exportation de la proteine 
de la fusion phoA. Par consequent, on peut attendre de 
cette construction une forte emission de lumiere et une 
bonne activite phoA (cf figures 53 et 54). 

"> Dans une deuxieme construction nommee pJVED/hspis 

fragment de 1,5 kb a ete clone a partir du plasmide deja 
decrxt pPM1745 (Servant et al . , 1995) . C e fragment inclut 
les nucleotides codants pour les dix premiers acides amines 
de la proteine de choc thermique de 18 kb issue de 

!5 Streptomyces albus (heat shock protein 18, HSP 18), le site 
de liaison du ribosome, le promoteur et, en amont, des 
sites regulateurs contraiant son expression. Cette proteine 
appartient a la famille de alpha-crystalline de HSP a 
faible poids moleculaire (Verbon et al., 1992) . Son 

.0 homologue issu de M. leprae, 1'antigene de 18 kDa, est deja 
connu pour etre induit durant la phagocytose par un 
macrophage murin de la lig n6e cellulaire J-774 
(Dellagostinet al., 1995). Dans des conditions de culture 
standard, le pJVED/hspia, montre une faible activite luc et 

»5 aucune activite phoA (cf figures 53 et 54). 
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Dans une troisieme construction, nommee 
pJVED/Pl9kDa. 1' insert issu de P Exp410 (Lim et a! . , 1995) a 
ete coupe et clone dans le SMC de pJvED a . Ce fragment 
xnclut les nucleotides codants pour les 134. premiers acides 
amines de la proline connue de M. tuberculosis 19 kDa et 
de ses sequences regulatrices . Comme cela a pu etre mis en 
Svxdence, cette proteine est une lipoproteine glycosylee 
(Garbe et al., 1993 , Herrmann et al., 1996). Sur les 
figures 53 et 54, on observe, pour cette construction, une 
bonne activite luc correspondant a un promoteur fort, mais 
1 'activite phoA est la plus forte des quatre constructions 
L-activite pboA elevee de cette proteine de fusion avec une 
lipoproteine s'explique par le fait qu'elle reste attachee 
a la paroi cellulaire par son extremite N-terminal 

run, ^ ^ qUatri6mS 6t d ^niere construction nommee 
pJVED/erp I' insert provient de P Exp53 (Lim et al., 1995) et 
a ete clone dans le SMC de P JVED a . pE x P 53 est le plasmide 
initial selectionne pour son activite phoA et contenant une 
partie du gene erp de M. tuberculosis qui code pour un 
antigene de 28 kDa. Ce dernier inclut la sequence signal 
une partie de la proteine mature et, en amont du codon 
d-initiation, le site de liaison de ribosome. Le promoteur 
a ete cartographic Une boite far (iron box) putative du 
type fur est presente dans cette region et encadre la 
region -35 du promoteur (Berthet et al . , 1995). Comme 
prevu (figures 53 et 54) cette construction presente une 
bonne emission lumineuse et une bonne activite phoA. Le 
fait que cette proteine de fusion, contrairement a la 
fusion avec la lipoproteine de 19 kDa, ne semble pas 
attachee a la paroi cellulaire n'exclut pas que la proteine 
native y soit associee. De plus, 1'extremite C-terminal de 
erp est absente de la proteine de fusion. 



Example 2 : Construction d'une banque d'ADN genomique de 
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M. tuberculosis dans les vecteurs P JVED S et identification 
d'un des membres de ces banques, (DP428) ,' induit au cours 
de la phagocytose par les macrophages murins derives de la 
moelle osseuse. 

Les differentes constructions sont testees pour 
leur capacite a evaluer 1 'expression intracellulaire des 
gSnes identifies par 1 'expression de phoA. Dans cet 
objectif, l'activite luc est exprimee en URL pour l 0 3 
bacteries en culture axenique et/ou dans des conditions 
intracellulars. L' induction ou la repression suivant la 
phagocytose par les macrophages murins derives de la moelle 
osseuse peut etre evaluee convenablement par la mesure des 
activites specif iques. Les resultats de deux experiences 
distinctes sont presented dans le tableau 2. 
•5 Le plasmide pJVED/hsplfl a ete utilise comme 

controle positif pour 1' induction durant la phase de 
croissance intracellulaire. Bien que 1 ■ induction du 
promoteur par le chauffage de la bacterie a 42«C n'ait pas 
Ste concluant la phagocytose de la bacterie conduit 
clairement a une augmentation de l'activite du promoteur. 
Dans toutes les experiences, l'activite 2uc intracellulaire 
a ete fortement induite, augmentant de 20 a 100 fois 
l'activite basale initialement faible (Servant, 1995). 

Le plasmide pJVED/blaF a ete utilise comme contrdle 
de la modulation non specifique au cours de la phagocytose 
De faibles variations ont pu etre mises en evidence 
probablement dues a des changements de conditions de 
cultures. Quoi qu'il en soit, ces faibles variations ne 
sont pas comparables a 1' induction observee avec le 
30 plasmide pJVED/hsplS. 

Tous les membres de la banque d'ADN ont ete testes 
par mesure de l'activite du promoteur durant la croissance 
intracellulaire. Parmi eux, le DP428 est fortement induit 
au cours de la phagocytose (tableaux l et 2). 
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TABLEAU 1 



Construction 



pJVED/A/a/.* 



pJVED/hsp/X 



pJVED//j/V2«V 



Construction 



% Recuperation 



0.5 



0.6 



0.7 



% Recuperation 
C57BL/6 Balb/C 



URL/10 3 
bact cries 
cxtracc llulairc 
1460 



8 



0.06 



URL/10 1 
bact erics 
extraccllulairc 




URL/1 0' 
bactcries 
intracellular 
1727 




57 



18 



URL/10 3 
bactcries 
intracellulairc 
CS7BL/6 Balb/ C 
250 911 



300 



Induction 
C57BL/6 Balb/C 



TABLEAU 2 



Construction 



% Recuperation 



URL/10 1 
bactcries 
extracellulairc 



URL/10 3 
bactcries 
intraccllulaire 



Induction 



10 



IS 



plVEDIhspl8 



1477 



367 



PJVED/DPJ28 



0.26 



21 



6.8 



0.25 



26 



0,14 



28 



Le fragment nucleotidique codant pour la region N- 
terminale du polypeptide DP428 de sequence SEQ id N o 28 est 
contenu dans le plasmide depose a la CNCM sous le N° I 
1818. 

La totality de la sequence codant pour le polypeptide 
DP428 a ete obtenue comrae detaillee ci-apres. 

Une sonde a ete obtenue par PGR a 1-aide des 
oligonucleotides de sequence SEQ ID N° 25 et SEQ ID N» 26 
Cette sonde a ete marquee par extension aleatoire en 
presence de »P dCTP. Une hybridation de 1-ADN genomique de 
M. tuberculosis souche Mtl03 prealablement digere par- 
l'endonuclease Seal a ete realisee a 1-aide de ladite 
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sonde. Les resultats de 1 • hybridation ont fait apparaitre 
qu-un fragment d'ADN d'environ 1,7 kb etait marque. Du fait 
qu'il existe un site Seal s'6tendant du nucleotide nt 984 
au nucleotide nt 989 de la sequence SEQ id N» i e'est a 
5 dire du c6te 5- de la sequence utilisee comme sonde, la fin 
de la sequence codante est necessairement presente dans le 
fragment detects par hybridation. 

L'ADN genomique de la souche Mt 103 de m. 
tuberculosis, apres digestion par Seal, a subi une 
10 migration sur un gel d'agarose. Les fragments de tallies 
comprises entre 1,6 et 1,8 kb ont ete clones dans le 
vecteur pSLllSO (Pharmacia) prealablement clive par Seal et 
dephosphoryle. Apres transformation de E. coli avec les 
vecteurs recombinants resultants, les colonies obtenues ont 
.5 «t« criblees a 1'aide de la sonde. Le criblage a permis 
d isoler six colonies hybridant avec cette sonde. 

Les inserts contenus dans les plasmides des clones 
recombinants precedemment selectionnes ont ete sequences 
pu 1S les sequences aligns de maniere a determiner la 
20 totalite de la sequence codant pour DP428, plus 
specif iquement la SEQ ID N° 2. 

Un couple d'amorces a ete synthetise afin d'amplifier 
^ partir de 1 ' ADN genomique de M. tuberculosis, souche Mt 

25 DP4 3 ; 8 la L. 0 ^ 1 ^ 6 ^ k 8 ' qUenCe C ° dant P ° Ur 16 peptide 
25 DP428. L'ampHcon obtenu a ete clone dans un vecteur 

d 1 expression. 

Des couples d'amorces appropries pour 1 ■ amplification 
et le clonage de la sequence codant pour le polypeptide 
DP428 peuvent etre aisement realises par 1'homme du metier 
30 sur la base des sequences nucleotidiques SEQ ID N<>1 et SEQ 



Un couple d- amorces particulier selon 1- invention est 
le couple d'amorces suivants, capable d'amplifier 1 1 ADN 
codant pour le polypeptide DP428 depourvu de sa sequence 
35 signal : 
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- Amorce aller (SEQ ID N» 29) , comprenant la 56quence 
allant du nucleotide en position nt 1021 au nucleotide nt 
1044 de la sequence SEQ ID N° 2 : 
5' - AGTGCA TGCTGCTGGf?rn^AcCATgA«rraan . 



3 



- Amorce retour (SEQ ID N<> 30), comprenant la sequence 
complementaire de la sequence allant du nucleotide en 
position nt 1345 au nucleotide en position nt 1325 de la 
sequence SEQ ID N° 2 : 

5' " CAGCCAGATC TGCGGGCflC CCTGP A rnnnnfri _ 3, 

dans lesquelles la partie soulignee represente les 
sequences hybridant specif iquement avec la sequence SEQ ID 
N« 2 et les extremites 5' correspondent a des sites de 
restriction en vue du clonage de 1-amplicon resultant dans 
un vecteur de clonage et/ou d' expression. 

Un vecteur particulier utilise pour 1- express ion du 
polypeptide DP428 est le vecteur pQE70 commercialise par la 
soci€t6 Qiagen. 

Exemplo 3 : La sequence complete du gene DP428 et de ses 
regions flanquantes. 

Une sonde de la region codante de DP428 a ete 
obtenue par ACP, et utilisee pour hybrider 1-adn genomique 
de differentes especes de mycobacteries . D'apres les 
resultats de la figure 3, le gene est present uniquement 
dans les mycobacteries du complexe de M. tuberculosis. 

L. analyse de la sequence suggere que DP428 pourrait 
30 faire partie d'un operon. La s6quence codante et les 
rSgions flanquantes ne presentent aucune homologie avec des 
sequences connues deposees dans les banques de donnees. 

D'apres la sequence codante, ce gene code pour une 
proteine de 10 kDa avec un peptide signal, une extremite C- 
termanal hydrophobe terminee par deux arginines et prec6dee 
par un motif LPISG semblable au motif connu LPXTG. Ces deux 
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ar 9 inines pourraient correspondre a un signal de retention 
et la proline DP428 pourrait etre accrochee par ce motif a 
des peptidoglycanes comme cela a deja ete decrit chez 
d'autres bacteries Gram* (Navarre et al., 1994 et 1996). 

Le mScanisme de survie et de croissance 
intracellular des mycobacteries est complexe et les 
relations intimes entre la bacterie et la cellule note 
restent inexpliquees . Quel que soit le mecanisme, la 
croissance et la survie intracellular des mycrobacteries 
depend de facteurs produits par la bacterie et capables de 
moduler la reponse de I'hote. Ces facteurs peuvent etre des 
molecules exposees a la surface cellulaire telle que LAM ou 
des proteines associees a la surface cellulaire, ou des 
molecules activement secrStees. 

D'un autre c6te, intracellulairement . les bacteries 
elles-memes doivent faire face a un environnement hostile 
Biles semblent y repondre par des moyens proches de ceux 
mis en oeuvre dans les conditions de stress, par 
1' induction de proteines de choc thermique (Dellagostin et 
20 al.. 1995), mais aussi par induction ou la repression de 
differentes proteines (Lee et al . , 1995). En utilisant une 
methodologie derivee de la PGR, Plum et Clark-curtiss (Plum 
et al., 1994) ont montre qu'un gene de M. avium inclu dans 
un fragment d-ADN de 3 kb, est induit apres la phagocytose 
par des macrophages humains. Ce gene code pour une proteine 
exportee comprenant une sequence leader mais ne presentant 
pas d'homologie significative avec les sequences proposees 
par les banques de donnees. L' induction, pendant la phase 
de croissance intracellular, d-une proteine de choc 
thermique de faible poids moleculaire issue de M. leprae a 
egalement ete mise en evidence (Dellagostin et al . , 1995) 
Dans une autre etude, les proteines bacteriennes de M. 
tuberculoaia ont ete metaboliquement marquees pendant la 
Phase de croissance intracellular ou bien dans des 
conditions de stress et separees par electrophorese sur gel 
a deux dimensions : 16 proteines de M. tuberculosis ont ete 



25 



30 



35 



WO 99/09186 



PCT/FR98/01813 



88 



1U 



15 



induites et 28 reprices. Les memes prolines sont mises en 
jeu au cours de stress provoque par un faible pH, un choc 
thermique, H 2 0 2 , ou au cours de la phagocytose par des 
monocytes humains de la lignee THPl . Quoi qu'il en soit le 
comportement des prolines induites et reprimees etait 
unique dans chaque condition (Lee et al . , 1995). Pris 
ensemble, ces resultats indiquent qu'un dialogue 
moleculaire subtile est mis en place entre les bacteries et 
leurs hdtes cellulaires. De ce dialogue depend probablement 
le sort de l'organisme intracellulaire. 

Dans ce contexte, 1> induction de 1' expression de 
DP428 pourrait etre d'une importance majeure, indiquant un 
role important de cette proteine dans la survie et la 
croissance intracellulaire. 

La methode utilisee dans ces experiences pour 
evaluer 1- expression intracellulaire des genes (cf. Jacobs 
et al., 1993, pour la methode de determination de 
1' expression de la lucif6rase de luciole, et Lim et al 
1995, pour la methode de determination de 1 'expression du 
g$ne PhoA) presente 1'avantage d'etre simple comparee aux 
autres techniques comme la technique decrite par Mahan et 
al. (Mahan et al . , 1993) adaptee aux mycobacteries et 
proposee par Bange et al. (Bange et al., 1996), ou la 
methode substractive basee sur l'ACP decrite par Plum et 
25 Clark-curtiss (Plum et al., 1994). u existe 
indiscutablement une variabilis comme le montre la 
comparaison des differentes experiences. Bien que provoquer 
1' induction ou la repression soit suffisant, il est 
desormais possible de 1-evaluer fournissant ainsi un outil 
30 supplemental^ d- etudes physiologiques des proteines 
exportees identifiees par fusion avec phoA. 
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Example 4 



Recherche d'une modulation de l'activite des promoteurs 
35 lors des phases intramacrophagiques . 
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Des macrophages de moelle osseuse de souris sent 
prepares comme decrit par Lang et Antoine (Lang et al., 
1991) . Les bacteries de M. segmentis recombinantes, dont on 
a determine 1'activite lucif erase par 10 3 bacteries comme 
precedemment, gon t incubees a 37<>c sous atmosphere 
humidifiee et enrichie en CG 2 a 5%, pendant 4 heures en 
presence de ces macrophages de telle maniere qu'elles 
soient phagocytees. Apres rincage pour eliminer les 
bacteries extracellulaires restantes, on ajoute au milieu 
de culture de 1 • amikacin* (100 M g/ml) pendant deux heures 
Apres un nouveau rincage, le milieu est remplace par un 
mxlxeu de culture (DMEM enrichi de 10 % de serum de veau et 
2 mM de glutamine) sans antibiotiques . Apres une nuit 
d' incubation comme precedemment, les macrophages sont lyses 
a froid (4«C) a 1'aide d'un tampon de lyse (cee lysis 
buffer, Promega), et 1'activite lucif erase par io 3 
bacteries determinee. Le rapport des activites a la mise en 
culture et apres une nuit donne le coefficient d> induction. 

Example 5 : 

Isolement d'une serie de sequences par sequencage 
directement a partir des colonies. 

Une serie de sequences permettant 1- expression et 
1' exportation de phoA ont ete ieolees a partir de l'ADN de 
M. Tuberculosis ou de M. Bovis BCG. Parmi ce groupe de 
sequences, deux d'entre elles ont ete d'avantage etudiees, 
les genes entiers correspondant aux inserts ont ete clones! 
sequences, et des anticorps centre le produit de ces genes 
ont servi a montrer en microscopie electronique que ces 
genes codaient pour des antigenes retrouves a la surface 
des bacilles de la tuberculose. L'un de ces genes erp 
codant pour une sequence signal d- exportation consenaus, 
1' autre des ne possedait aucune caracteristique de gene 
codant pour une proteine exportee, d' apres la sequence. Un 
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autre gene DP428 a ete sequence avant que la sequence du 
genome de M. Tuberculosis ne soit disponible. II contient 
une sequence, ressemblant a la sequence consensus 
d'attachement au peptidoglycane, ce qui suggere qu'il 
s'agit aussi d'un antigene vraisemblablement retrouve a la 
suface des bacilles de la tuberculose. L'Stude des trois 
genes erp, des. et celui codant pour DP428 montre que le 
systeme phoA q Ue nous avons developpe chez les 
mycobacteries permet de reperer des genes codant pour des 
proteine exportees sans determinant reperable par des 
etudes in silico. Ceci est particulierement vrai pour les 
polypeptides qui ne possedent pas de sequence signal 
consensus (des) ou non pas de similarity avec des proteines 
de fonction connue (erp et DP428) . 



Un certain nombre d' inserts ont ete identifies et 
sequences avant la connaissance du genome de W . 
Tuberculosis, d'autres apres. Ces sequences peuvent itre 
considerees comme des amorces permettant de rechercher des 
genes codant pour des proteines exportees. A ce jour, une 
serie d' amorces ont ete sequences et les genes entiers 
correspondants ont ete soit sequences, soit identifies 
d- apres la sequence publiee du genome. Pour tenir compte 
des erreurs de sequencage tou jours possibles, les regions 
25 en amont ou en aval de certaines amorces ont ete 
considerees comme pouvant faire partie de sequences codant 
pour des proteines exportees. Dans certains cas des 
similarity avec des genes codant pour des prolines 
exportees ou des sequences caracteristiques de signaux 
d • exportation ou des caracteristiques topologiques de 
protSines membranaires ont ete detectees. 

Des sequences amorces s'averent corresponds a des 
gSnes appartenant a des families de genes possedant plus de 
35 5 0 % de similarity On peut ainsi indiquer que les autres 
g&nes dStectes par similarity avec une amorce codent pour 
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des proteines exportees. C'est le cas de la sequence SEQ ID 
N° 8G et SEQ ID N° 8H possedant plus de 77 % de similarity 
avec SEQ ID N° 8A' . 

Les sequences pouvant coder pour des proteines 
exportees sont les suivantes : SEQ ID N" l, 8, 9, 8G, 8H 
13, 3, 10, 19, 20, 6, 16, 22, 23, 24, 39, 44, 46, et 50. 

Des genes identifies d'apres les amorces a partir de 
la sequence du genome n'ont aucune caracteristique (d'apres 
la sequence) de proteines exportees. il s'agit des 
sequences suivantes : SEQ ID N" 4, 27, n, 12, 14< 7, 15 
17, 18, 21, 31, 32, 33, 34, 35, 36, 37, 38, 40,' 41,' 42 ', 43,' 
45, 47, 48, et 49. 

D'apres la sequence d'autres organismes comme E. coli, 
on peut rechercher dans la sequence du genome de M. 
tuberculosis, des genes possedant des similarity avec des 
proteines connues pour etre exportees chez d'autres 
organismes bien que ne possedant pas de sequence signal 
d' exportation. Dans ce cas une fusion avec phoA est un 
protocole avantageux pour determiner si ces sequences de M. 
tuberculosis cedent pour des proteines exportees bien que 
ne presentant pas de sequence signal consensus. II a ete en 
effet possible de doner SEQ id N* 49, une sequence 
25 similaire a un gene de B. coli de la famille htrA. Une 
fusion de SEQ ID N o 49 avec phoA conduit a 1- expression et 
a 1' exportation de phoA. Des colonies M. smegmatis 
hebergeant une fusion SEQ ID N«> 49 phoA sur un plasmide 
pJVED sont bleues. 

30 SEQ ID N« 49 est done consideree comme une proteine 

exportee . 

La methode phoA est done utile pour detecter d'apres 
la sequence de M. Tuberculosis des genes codant pour des 
proteines exportees sans qu'ils ne codent pour des 
35 sequences caracteristiques des proteines exportees. 
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Meme si une sequence possede des determinants de 
prolines export£es, cela ne dSmontre pas une exportation 
fonctionnelle. Le syst&me phoA permet de montrer que le 
gdne suspect^ code rSellement pour une proteine export£e. 
Ainsi, il a 6t6 v6rifi6 que la sequence SEQ ID N° 50 
poss£dait bien des signaux d 1 exportation. 



TABLEAU 3 



SEQ ID N° 


Reference de la 
sequence 

correspondante predite 
par Cole et al. 




nnnocduion 


SEQ ID N°l 


Rv 0203 


* 


oc^uciiuc nyaropnooe en 
N-terminal 


SEQ ID N°4 
SEQ ID N°27 


Rv 2050 




Pas de prediction 


SEQ ID N°8 
SEQ ID N°9 


Rv 2563 


* 


Proteine membranaire 


SEQ ID N° 
8G* , H 1 


Rv 0072 


* 


Possible proteine de 
transport transmembranaire 
de type ABC 


SEQ ID N°ll 


Rv 0546c 


ML 


l LULClll O U LiaCuOyj. 

Glutathione-methyl 
glyoxal lyase 


SEQ ID N°12 


pas de prediction 




non retrouve dans 
M. tuberculosis H37rv 


SEQ ID N P 13 
SEQ ID N°3 
SEQ ID N°10 


Rv 1984c 


* 


probable precurseur 
cutinase avec une sequence 
signal N-terminale 


SEQ ID N°14 
SEQ ID N°7 


pas de prediction 




pas de prediction 


SEQ ID N°15 


avec d6calage de 
lecture, pourrait etre 
en phase avec Rv 2530c 




pas de prediction 


SEQ ID N*17 


Rv 1303 


ML 


pas de prediction 


SEQ ID N°18 


Rv 0199 


ML 


pas de prediction 


SEQ ID N°19 


Rv 0418 


* 


site de fixation de lipo- 
proteine membranaire 
procaryote, similarite avec 
la N-ac6tyl puromycyne 
acetyl hydrolase 


SEQ ID N°20 
SEQ ID N°6 


Rv 3576 




contient un site de 
fixation de lipoprot6ine 
membranaire procaryote, 
similarite avec une 
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serine/threonine proteine 
kinase 


SBQ ID N° 21 


Rv 3365c 


ML 


similarity avec une metailo 
peptidase 3 zinc 




non pr6ditc 





gas de pr6diction 


SEQ ID N°32 


Rv 0822c 


ML 


Existence d'une region 
consensus avec la famille 
drac 


SEQ ID N°33 


Rv 1044 




pas de prediction 


Q pn T n M ° "3 A 


non predite 




pas de prediction 


Q C*^ T rv m° 1R 


Rv 2169c 




pas de prediction 


XU N JO 


Rv 3909 


ML 


pas de prediction 


SEQ ID N°37 


Rv 2753c 




similarity avec des 

dihydropricolinate 

synthases 


SEO ID N°3ft 


tw Ul / D 




pas de prediction 


SEO ID N°1Q 


t\V o uu o 


• 

ML 


prediction de sequence 
signal de lipoproteine 


SEO ID N°4fl 


Pit Qr» 

t\v udiuc 




pas de prediction 


SEO ID N°41 

''^x xu* in IX 


Rv 2975c pouvant etre 
en phase avec Rv 2974c 




similarity avec proteine de 
substilis 


SEQ ID N°42 


Rv 2622 




similarite avec une methyl 
transferase 


SEQ ID N°43 


Rv 3278c 


ML 


pas de prediction 


SEQ ID N°44 


Rv 0309 


* 


pas de prediction 


SEQ ID N°45 


Rv 2169c 


ML 


pas de prediction 


SEQ ID N°4 6 


Rv 1411c 


* 


probable lipoproteine 
avec une sequence signal 
N-terminale 


SEQ ID N°47 


Rv 1714 




similarite avec une ~~ 
gluconate 3-dehydrogenase 


SEQ ID N°48 


Rv 0331 




similarite avec une sulfide 
dehydrogenase et une 
sulfide quinone reductase 


SEQ ID N°4 9 


Rv 0983 


ML 


Similarite avec une serine 
protease HtrA 
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SEQ ID N°16 


Rv 3810 


* 

ML 


Prot6ine de surface 
Bcrthelct ct al. 1995 


SEQ ID N°22 
SEQ ID N*23 
SEQ ID N°24 


Rv 3763 


* 


ContienL un site de 
iiAdnon ae lipoproteme 
membranaire eucaryote 


SEQ ID N°50 


Rv 0125 


■* 


Site actif des serines 
proteases 

Sequence signal N-terminale 
possible 



Legende du tableau 3 : 

Correspondence des sequences selon 1- invention avec les 
sequences predites par Cole et al . 1998, Nature, 393, 537- 
5 544. 

* : Prediction que la proteine codee par la sequence 

soit exportee 
ML : Prediction de similarity avec M. leprae. 
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10 Exemple 6 : 

Caracteristiques et obtention de la proteine M1C25 

L'extremite N terminale de la proteine M1C25 a ete 
detectee par le systeme PhoA comme permettant 1 'exportation 
de la proteine de fusion, necessaire a 1 'obtention de son 
activite phosphatase. 

La sequence d'ADN codant pour l'extremite N terminale de 
la proteine M1C25 est contenue dans la sequence SEQ ID N° 
20 de la presente demande de brevet. 

A partir de cette sequence amorce, le gene complet 
codant pour la proteine M1C25 a ete recherche dans le 
genome de M. tuberculosis (Fondation Welcome Trust, site 
Sanger) . 

Le centre Sanger a attribue a M1C25 les noms: 
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Rv3576, 

MTCY06G11.23, 

pknM 

5 S6gue n?g SEQ ID N° 29 du gene mn,n l et M1C ^ / 714 feaagsj : 
cf. Figure 29 

Ce gene code pour une proteine de 237 AA, de 25 kDa de 
masse molaire. Cette proteine est referencee dans les 
banques sous les appellations: 
PID:e306716, 
SPTREMBL: P96858 

Sequence SEQ ID N° 30 de 1* p r- pteine Mir?s (237 ,r^ QO 
15 amines ) •. cf . Figure 30 

M1C25 contient un site de fixation a la partie 
lipidique des lipoproteines de membrane des procaryotes 
(PS00013 Prokaryotic membrane lipoprotein lipid attachment 
20 site: 

CTGGTCGGTG CGTGCATGCT CGCAGCCGGA TGC) . 

La fonction de M1C25 n'est pas certaine mais elle 
possede tres probablement une activite " serine/threonine - 
proteine kinase". Des ressemblances sont a noter avec la 
25 moitie C terminale de K08G_MYCTU Q11053 Rvl266c 
(MTCY50.16). Des similarites sont aussi retrouvees avec 
KY28_MYCTU. 

En 5' du gene codant pour M1C25 se trouve un gene 
codant potentiellement pour une proteine regulatrice 
(PID:e306715, SPTREMBL: P96857, Rv3575c, (MTCY06G11 . 22c) ) 

Le profil d'hydrophobicitg (Kyte et Doolitle) de M1C25 
est represente a la figure 56. 

Un site de clivage de la sequence signal est predit 
(SignalP VI. 1; World Wide Web Prediction Server, Center for 
Biological Sequence Analysis) entre les acides amines 31 et 
32: AVA-AD. Ce site de coupure est derriere un motif "AXA" 
classique. Cette prediction est compatible avec le profil 
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d ' hydrophobicite . Dans cette sequence signal potentielle il 
est a remarque la repetition trois fois de la sequence des 
trois acides amines LAA. 

Clonage du gene M1C25 en vue de la production de la 
proteine qu'il code: 

Un couple d' amorces a ete synthetise afin d' amplifier, 
a partir de l'ADN genomique de M. tuberculosis, souche 
H37Rv, la totalite de la sequence codant pour le 
polypeptide M1C25. L'amplicon obtenu a ete clone dans un 
vecteur d ' expression . 



Des couples d' amorces appropries pour 1 • amplification 
et le clonage de la sequence codant pour M1C25 ont ete 
synthetises : 
-amorce aller : 

5' -ATAATACCATGGGCAAGCAG CTAGCCGrftr - 3 « 
-amorce retour : 

5' -ATTTATAGATCTCTGCTTAG CAACCTTflflrrnrn - 3 ' 

La partie soulignee represente les sequences hybridant 
specifiquement avec la sequence M1C25 et les extremites 5' 
correspondent a des sites de restriction en vue du clonage 
de l'amplicon resultant dans un vecteur de clonage et/ou 
d' expression. 

Un vecteur particulier utilise pour 1' expression du 
polypeptide M1C25 est le vecteur pQE60 commercialise par la 
societe Qiagen, en suivant le protocole et les 
recommandations proposes par cette marque. 

Les cellules utilisees pour le clonage sont des 
bacteries : E. coli XLl-Blue (resistante a la 
tetracycline) . 

Les cellules utilisees pour 1' expression sont des 
bacteries : e. coli M15 (resistante a la kanamycine) 
contenant le plasmide pRep4 (M15 pRep4) . 



WO 99/09186 



PCT/FR98/01813 



97 



La production de la protSine MC25 est illustree par les 
figures 57 A et B. ( Extraits bact£riens de la souche E. 
coli M15 contenant le plasmide pMlC25. Les cultures 
bactSriennes et les extraits sont prepares selon Sambrook 
et al. (1989). L 1 analyse des extraits bacrSriens est 
effectu£e selon les instructions de Quiagen (1997) . 
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REVENDICATIONS 



10 



15 



20 



25 



30 



1. Vecteur recombinant de criblage, de clonage et/ou 
d'expression, caracterise en ce qu'il se replique chez des 
mycobacteries et en ce qu'il contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 

3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) Sventuellement un terminateur de transcription actif 
chez les mycobacteries, en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'expression, d'exportation et/ou 
de secretion de proteine, ladite sequence nucleotidique 
etant depourvue de son codon d- initiation et de ses 
sequences de regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucleotidique etant 
pourvue de son codon d' initiation. 

2. Vecteur recombinant selon la revendication 1, 
caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'expression, 
d'exportation et/ou de secretion de proteine est une 
sequence codante issue du gene phoA de la phosphatase 
alcaline. 

3. Vecteur recombinant selon l'une des revendications 1 et 
2, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'expression 
d'exportation et/ou de secretion de proteine est une 
sequence codante du gene de la P-agarase, de la nuclease 
d'un staphylocoque ou de la p-lactamase d'une mycobacteria . 
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4. Vecteur recombinant selon l'une des revendications 1 a 
3, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
5 codante issue du gene luc de la lucif erase de luciole. 



a 



to 



30 



35 



5. Vecteur recombinant selon l'une des revendications 1 
4, caracterise en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 
codante issue du gene GFP de la Green Fluorescent Protein. 



6. Vecteur recombinant selon l'une des revendications 1 a 

5, caracterise en ce que le terminateur de transcription 
15 actif chez les mycobacteries est le terminateur du 

coliphage T4 (tT4) . 

7. Vecteur recombinant selon l'une des revendications 1 a 

6, caracterise en ce qu'il est un plasmide choisi parmi les 
20 plasmides suivants deposes a la CNCM (Collection Nationale 

de Cultures de Microorganismes, Paris, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, 
le 12/12/1996, 

b) pJVEDb depose a la CNCM sous le N° 1-1906, le 25 juillet 
25 1997, 

c) pJVEDc depose a la CNCM sous le N» 1-1799 le 
12/12/1996. 

8. Vecteur recombinant selon l'une des revendications 1 a 

7, caracterise en ce qu'il comprend en l'un des sites de 
clonage du polylinker une sequence d'acide nucleique de 
mycobacterie chez laquelle on detecte un polypeptide 
susceptible d'etre exporte et/ou secrete, et/ou d'etre 
induit ou reprime lors de 1' infection par ladite 
mycobacterie ou encore exprime ou produit de facon 
constitutive, ainsi que les sequences promotrices et/ou 
regulatrices associees susceptibles de permettre ou de 
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favoriser 1 ' exportation et/ou la secretion dudit 
polypeptide, ou tout ou partie de gene codant pour ledit 
polypeptide. 

5 9. Vecteur recombinant selon l'une des revendications 1 a 

8, caracterise en ce que la sequence d'acide nucleique de 
mycobacterie qu'il contient est obtenue par fragmentation 
physique ou par digestion enzymatique de l'ADN genomique ou 
de l'ADN complement a ire d'un ARN d'une mycobacterie. 

10 

10. Vecteur recombinant selon l'une des revendications 1 a 

9, caracterise en ce que ladite mycobacterie est M. 
tuberculosis. 

15 ll. Vecteur recombinant selon l'une des revendications l a 
9, caracterise en ce que ladite mycobacterie est choisie 
parmi M. africanum, M. bovis, M. avium ou M. leprae. 

12. Vecteur recombinant selon la revendication 10, 
20 caracterise en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes 3 la CNCM : 

a) p6D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1814, 

b) p5A3 depose le 28 janvier 1997 a la CNCM sous le N»I- 
25 1815, 

c) P 5F6 depose le 28 janvier 1997 a la CNCM sous le N»I- 
1816, 

d) P 2A29 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1817, 

30 e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
35 1 82 0, 

h) p2D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 
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i) plB7 depose le 31 janvier 1997 a la CNCM sous le N<>I- 
1843, 

j) pJVED/M. tuberculosis depose le 25 juillet 1997 a la 
CNCM sous le N° 1-1907, 
5 k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n»I-2062. 

13. Vecteur recombinant selon la revendication 12, 
caracterise en ce qu'il s'agit du plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°l-i818. 

10 

14. Procede de criblage de sgquences de nucleotides issues 
de mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 
pouvant etre induits ou reprimes lors de 1' infection, leurs 

15 sequences promotrices et/ou regulatrices associees 
susceptibles notamment de permettre ou de favoriser 
1' exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterise en ce qu'il met en oeuvre 

20 un vecteur selon l'une des revendications l a 13, 

15. Procede de criblage selon la revendication 14. 
caracterise en ce qu'il comprend les etapes suivantes : 

a) la fragmentation physique des sequences d'ADN de 
25 mycobacteries ou leur digestion par au moins une enzyme 

determinee et la recuperation des fragments obtenus ; 

b) 1' insertion des fragments obtenus a l'etape a) dans un 
site de clonage, compatible le cas echeant avec 1' enzyme de 
l'etape a), du polylinker d'un vecteur selon l'une des 

30 revendications 1 a 13 

c) si besoin, 1' amplification desdits fragments contenus 
dans le vecteur, par exemple par replication de ce dernier 
apres insertion du vecteur ainsi modifie dans une cellule 
determinee, de preference E coli ; 

35 d) la transformation de cellules hdtes par le vecteur 
amplifie a l'etape c) , ou en l'absence d' amplification, par 
le vecteur de l'etape b) ; 
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10 



e) la culture de cellules notes transf ormees dans un milieu 
permettant la mise en evidence du marqueur d' exportation 
et/ou de secretion, et /ou du marqueur d'activite de 
promoteurs contenu dans le vecteur ; 

f) la detection des cellules hotes positives (colonies 
positives) pour 1 'expression du marqueur d'exportation 
et/ou de secretion, et /ou du marqueur d'activite de 
promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1' insertion de cet ADN dans une cellule identique a celle 
de l'etape c) ; 

h) la selection des insertions contenues dans le vecteur, 
permettant l'obtention de clones positifs pour le marqueur 
d'exportation et/ou de secretion, et /ou pour le marqueur 

15 d'activite de promoteurs ; 

i) l'isolement et la caracterisation des fragments d * AON de 
mycobacteries contenues dans ces inserats, et l'6tape i) du 
precede pouvant comporter en outre une etape de sequencage 
des insertions select ionnees . 

20 

16. Banque d' ADN genomique ou d ' ADNc complementaire d'ARNm 
de mycobacterie, caracterisee en ce qu'elle est obtenue par 
un precede selon la revendication 14 et/ou un procede 
comprenant les etapes a) et b) , ou a) , b) et c) du procede 

25 selon la revendication 15. 

17. Banque d' ADN genomique ou d' ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 16. caracterisee en 
ce que ladite mycobacterie est une mycobacterie pathogene. 

18. Banque d' ADN genomique ou d 1 ADNc. complementaire d'ARNm 
de mycobacterie selon la revendication 17, caracterisee en 
ce que ladite mycobacterie est une mycobacterie appartenant 
au groupe du complexe Mycobacterium tuberculosis. 
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19. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 18, caracterisee en 
ce que ladite mycobacterie est Mycobacterium tuberculosis. 

20. Sequence nucleotidique de mycobacterie ou comprenant 
une sequence nucleotidique de mycobacterie susceptible 
d'etre selectionnee par un procede selon l'une des 
revendications 14 et 15. 



10 21. Sequence nucleotidique de mycobacterie ou comprenant 
une sequence nucleotidique de mycobacterie selon la 
revendication 20, caracterisee en ce que ladite 
mycobacterie est choisie parmi M. tuberculosis, M. bovis, 
M. africanum, M. avium, M. leprae, M. paratuberculosis. M. 

15 kansassi ou M. x6nopi. 

22. Sequence nucleotidique selon l'une des revendications 
20-21 caracterisee en ce qu'elle est choisie parmi les 
sequences de fragments d'ADN de mycobacterie de sequence 

20 nucleique SEQ ID N°l a SEQ ID N«» 24C, SEQ ID N-»27A a SEQ ID 
N°27C. SEQ ID N°29 et SEQ ID N° 31A a SEQ ID N°50F. 

23. Sequence nucleotidique de mycobacterie l'une des 
revendications 20-21 caracterisee en ce qu'elle est choisie 

25 parmi les sequences de fragments d'ADN de mycobacterie de 
sequence SEQ ID N»l, SEQ ID N<>3A, SEQ ID N°5A, SEQ ID N°6A, 
SEQ ID N'7A, SEQ ID N*8A, SEQ ID N^A, SEQ ID N'lOA, SEQ ID 
N-27A ou SEQ ID N«>29 contenus respect ivement dans les 
vecteurs pDP428 (CNCM, N^l-ieie) , p6D7 (CNCM, N»I-l8i 4 ) 

30 P 5F6 (CNCM, N'I-1816) , p2A29 (CNCM, N<»I-1817), p 5 B5 (CNCm' 
N°I-1819) /P 1C7 (CNCM, ^1-1820) , p2D7 (CNCM, N°I-1821) ' 
P1B7(CNCM, N«»I-1843), p 5 A3 (CNCM, N«>I-1815) et P M1C25 
(CNCM, N»I-2062) . 

35 24. Sequence nucleotidique comprenant la totalite du cadre 
ouvert de lecture d'une sequence selon l'une quelconque des 
revendications 20 a 23. 
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25. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est cotnplementaire de 
la sequence d'un polynucleotide selon l'une des 
revendications 20 a 24, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon l'une des 
revendications 20 a 24, 

c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon l'une 
des revendications 20 a 24, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon l'une des revendications 20 a 

15 24 ou defini en a) . 

26. Polypeptide, leurs fragments ou fragments 
biologiquement actifs ou leurs polypeptides homologues, 
susceptible d'etre code par une sequence nucleotidique de 
mycobacterie selon l'une des revendications 20 a 25, et 
susceptible d'etre exporte et/ou secrete, et/ou induit ou 
reprime, ou exprime de facon constitutive lors de 
1 ' infection. 



20 



25 



30 



35 



27. Mycobacterie recombinante caractdrisee en ce qu'elle 
est transforttiee par un vecteur recombinant selon l'une des 
revendications 1 i 13. 

28. Polynucleotide dont la sequence est choisie parmi les 
sequences nucleotidiques de sequence SEQ ID N°l a SEQ ID 
N°2. 

29. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucleotidiques SEQ ID N°l a SEQ ID N°2, 
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b) un polynucleotide dont la sequence nucleique est la 
sequence comprise entre le nucleotide en position nt 964 et 
le nucleotide en position nt 1234, extremites indues, de 
la sequence SEQ ID N°i, 

c) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) ,c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide dSfini en a), b) , c) , d)ou e) . 

30. Polynucleotide selon l'une des revendications 20 a 25, 
28 et 29, caracterise en ce que sa sequence nucleique 
hybride avec 1 'AON de sequence de mycobacteries et 
preferentiellement avec de l'ADN de sequences de 
mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis. 

31. Polypeptide caracterise en ce qu'il est code par une 
sequence polynucleotidique selon l'une des revendications 
20 a 25. 

32. Polypeptide caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

a) un polypeptide dont la sequence d- acides amines est 
comprise dans une sequence d- acides amines choisie parmi 
les sequences d' acides amines SEQ ID N° l & S EQ ID N° 24C 
SEQ ID No 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide defini en a) , 

c) un fragment d'au moins 5 acides amines d'un polypeptide 
defini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 
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33. Polypeptide dont la sequence d'acides amines est 
comprise dans la sequence d'acides amines SEQ ID N°l ou SEQ 
ID N°2, ou polypeptide de sequence d'acides amines SEQ ID 
N°28. 

34. Polynucleotide caracterise en ce qu'il code pour un 
polypeptide selon l'un des revendications 32 et 33. 

35. Sequence d'acide nucleique utilisable comme amorce, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique de polynucleotide selon 
l'une des revendications 20 a 25, 28 a 30, et 34. 

36. Sequence d'acide nucleique selon la revendication 35, 
caract6risee en ce que ladite sequence est choisie parmi 
les s6quences SEQ ID N°25 et SEQ ID N°26. 

37. Sequence d'acide nucleique selon l'une des 
revendications 35 et 36 pour la detection et/ou 
1 'amplification de sequences nucleiques. 

38. Sequence d'acide nucleique utilisable comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique selon l'une des 
revendications 20 a 25, 28 a 30, et 34. 

39. Sequence d'acide nucleique selon la revendication 38, 
caracterisee en ce qu'elle est marquee par un compose 
radioactif ou par un compose non radioactif . 

40. Sequence d'acide nucleique selon l'une des 
revendications 38 et 39, caracterisee en ce que celle-ci 
est immobilisee sur un support, de. maniere covalente ou 
non-covalente . 



WO 99/09186 



PCT/FR98/01813 



114 



10 



IS 



41. Sequence d'acide nucleique selon l'une des 
revendications 38 a 40 pour la detection et/ou 
1' amplification de sequences nuclSiques. 

42. Sequence d'acide nucleique selon l'une des 
revendications 38 a 41. caracterisee en ce que ladite 
sequence est une sequence comprise entre le nucleotide en 
position nt 964 et le nucleotide en position nt 1234, 
extremites indues, de la sequence SEQ ID N°l. 

43. Vecteur recombinant de clonage, d'expression et/ou 
d' insertion .caracterise en ce qu'il contient une sequence 
d'acide nucleique de polynucleotide selon l'une des 
revendications 20 a 25, 28 a 30, et 34. 

44. Cellule h6te, caract6risee en ce qu'elle est 
transformee par un vecteur recombinant selon la 
revendication 43. 

20 45. Cellule note selon la revendication 44, caracterisee en 
ce qu'il s'agit de la souche de E. coli transformee par le 
plasmide pDP428 depose le 28 janvier 1997 a la CNCM sous le 
N'I-1818 ou transformee par le plasmide P M1C25 depose le 
4 aout 1998 a la CNCM sous le n<> 1-2062, ou d'une souche de 

25 M. tuberculosis, M. bovis ou M. africanum possedant 
potentiellement tous les systemes de regulation appropries. 

46. Precede de preparation d'un polypeptide, caracterise en 
ce qu'il met en oeuvre un vecteur selon la revendication 

30 4 3. 

47. Polypeptide recombinant susceptible d'etre obtenu par 
un procede selon la revendication 46. 



35 



48. Polypeptide hybride, caracterise en ce qu'il comporte 
au moins la sequence d'un polypeptide selon l'une des 
revendications 26, 32, 33 et 47 et une sequence d'un 



WO 99/09186 



PCT/FR98/01813 



115 



10 



15 



polypeptide susceptible d'induire une reponse immunitaire 
chez l'homme ou 1' animal. 

49. Polypeptide hybride selon la revendication 48, 
caracterise en ce que le polypeptide susceptible d'induire 
une reponse immunitaire contient au moins un determinant 
antigenique capable d'induire une reponse humorale et/ou 
cellulaire. 

50. Polynucleotide codant pour un polypeptide hybride selon 
l'une des revendications 48 et 49. 

51. Polypeptide hybride selon l'une des revendications 48 
et 49, caracterisee en ce qu'il s'agit d'une proteine 
recombinante obtenue par 1' expression d'un polynucleotide 
selon la revendication 50. 

52. Precede pour la detection in vitro d'anticorps diriges 
centre une mycobacterie et preferentiellement une bacterie 
du complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact de 1 • echantillon biologique avec un 
polypeptide selon l'une des revendications 26, 32, 33 et 

25 47 ; 

b) mise en evidence du complexe antigene-anticorps forme. 

53. Procede pour la detection d'une infection par une 
mycobacterie et preferentiellement une bacterie du complexe 

30 Mycobacterium tuberculosis dans un mammifere, caracterise 
en ce qu'il comprend les etapes suivantes : 
a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 
du systeme immunitaire dudit mammifere et plus 

35 particulierement encore des cellules T ; 
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b) incubation de 1 ' echantillon biologique de l'etape a) avec 
un polypeptide selon l'une quelconque des revendications 
26, 32, 33 et 47 ; 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation prealable du mammifere audit polypeptide 
notamment la proliferation cellulaire et/ou la synthese de 
proteines telles que 1 ' interferon gamma; 

d) detection d'une reaction d' hypersensibilite retardee ou 
de sensibilisation du mammifere audit polypeptide. 

54. Kit pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis, comprenant : 

a) un polypeptide selon l'une des revendications 26, 32, 33 
15 et 47 ; 

b) le cas ech6ant, les reactifs pour la constitution du 
milieu propice a la reaction immunologique; 

c) les reactifs permettant la detection des complexes 
ant igene- anticorps produits par la reaction immunologique ; 

20 d) le cas echeant, un echantillon biologique de reference 
(temoin negatif) depourvu d'anticorps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantite predeterminee 

25 d'anticorps reconnus par ledit polypeptide. 

55. Anticorps mono- ou polyclonaux, leurs fragments, ou 
anticorps chimeriques, caracterises en ce qu'ils SO nt 
capables de reconnaitre specif iquement un polypeptide selon 
l'une des revendications 26, 32, 33 et 47 

56. Anticorps selon la revendication 55, caracterise en ce 
qu'il s'agit d'un anticorps marque. 

57. Procede pour la detection specif ique de la presence 
d'un antigene d'une bacterie du complexe Mycobacterium 
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tuberculosis dans un Echantillon biologique, caract6risS en 
ce qu'il comprend les Stapes suivantes : 

a) mise en contact de 1 ■ 6chant illon biologique avec un 
anticorps selon l'une des revendications 55 et 56 ; 
5 b) mise en Evidence du complexe antigdne-anticorps form£. 

* 

58. Kit pour la detection specif ique de la presence d'un 
antigene d'une bact6rie du complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en 
ce qu'il comprend les el6ments suivants : 

a) un anticorps polyclonal ou monoclonal selon l'une des 
revendications 55 et 56 ; 

b) les reactifs pour la constitution du milieu propice a la 
reaction immunologique ; 

c) les reactifs permettant la detection des complexes 
antigene -anticorps produits par la reaction immunologique. 

59. Precede de detection et d' identification rapide d'une 
mycobacterie et pref erentiellement de M. tuberculosis dans 

20 un echantillon biologique, caracterise en ce qu'il 
comporte les etapes suivantes : 

a) isolement de l'ADN a partir de 1 ' echantillon biologique 
a analyser, ou obtention d'un ADNc a partir de l'ARN de 
1* echantillon biologique ; 
25 b) amplification specif ique de l'ADN des mycobacteries 
appartenant au complexe Mycobacterium tuberculosis a 
l'aide d' amorces selon l'une des revendications 35 a 37 ; 
c) analyse des produits d' amplification. 
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60. Procede pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique selon 
l'une des revendications 38 a 42 avec un echantillon 
biologique, l'ADN contenu dans 1 • echantillon biologique 
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ayant, le cas echeant, prealablement ete rendu accessible a 
1' hybridation, dans des conditions permettant 1 ' hybridation 
de la sonde a l'ADN d'une bacterie du complexe 
Mycobacterium tuberculosis ; 

b) detection de l'hybride forme entre la sonde 
oligonucleotidique et l'ADN de 1 ' echantillon biologique. 

61. Procede pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique 
immobilisee sur un support selon la revendication 40 avec 
un echantillon biologique, l'ADN de 1 'echantillon, ayant, 

15 le cas echeant, ete prealablement rendu accessible a 
1' hybridation, dans des conditions permettant 
1' hybridation de la sonde a l'ADN d'une bacterie du 
complexe Mycobacterium tuberculosis ; 

b) mise en contact de l'hybride forme entre la sonde 
oligonucleotidique immobilisee sur un support et l'ADN 
contenu dans 1 'echantillon biologique, le cas echeant 
apres elimination de l'ADN de 1 • echantillon biologique 
n' ayant pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon la revendication 39. 
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62. Procede de detection selon la revendication 61, 
caracterise en ce que, prealablement a l'etape a), l'ADN de 
1' echantillon biologique, ou l'ADNc obtenu par 
transcription inverse de l'ARN de 1 • echantillon, est 
amplifie a l'aide d'un couple d- amorces selon l'une des 
revendications 35 a 37. 



63. Procede pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 
35 un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 
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a) mise en contact de 1 ' Echantillon biologique avec un 
couple d' amorces selon 1'une des revendications 35 a 37, 
l'ADN contenu dans 1 • Echantillon ayant 6t6, le cas 6ch<5ant, 
prEalablement rendu accessible a 1 1 hybridation, dans des 
conditions permettant une hybridation des amorces a 1 1 ADN 
d'une bactErie du complexe Mycobacterium tuberculosis ; 

b) amplification de 1 1 ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 1 amplification de fragments d ' ADN 
correspondant au fragment encadrS par les amorces, par 
exemple par ElectrophorSse sur gel ou au moyen d'une sonde 
oligonuclEotidique marquee selon la revendication 39. 

64. ProcedS pour la detection de la presence d'une bact6rie 
appartenant au complexe de Mycobacterium tuberculosis dans 

un echantillon biologique, caractSrisS en ce qu'il comprend 
les etapes suivantes : 

a) mise en contact de 1 1 Echantillon biologique avec deux 
couples d' amorces selon l'une des revendications 35 £ 37, 
20 l'ADN contenu dans 1 1 echantillon ayant Ete, le cas 
EchEant, prEalablement rendu accessible a 1 • hybridation, 
dans des conditions permettant une hybridation des amorces 
a l'ADN d'une bactErie du complexe Mycobacterium 
tuberculosis ; 

25 b) amplification de l'ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 ' amplification de fragments d' ADN 
correspondant au fragment encadrE par lesdites amorces, par 
exemple par ElectrophorSse sur gel ou au moyen d'une sonde 
oligonuclEotidique marquEe selon la revendication 39. 
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65. Kit pour la detection de la presence d'une bactErie du 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caractErisE en ce qu'il comprend les Pigments 
35 suivants : 
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a) une sonde oligonuclSotidique selon l'une des 
revendications 38 £ 42 ; 

b) les rgactifs n^cessaires £ la mise en oeuvre d'une 
reaction d' hybridation ; 

c) le cas 6ch6ant, un couple d' amorces selon l'une des 
revendications 35 a 37 ainsi que les r<§actifs nScessaires 
k une reaction d 1 amplification de 1 'ADN (ADN g6nomique, 
plasmidique ou ADNc) d'une bactfirie du complexe 
Mycobacterium tuberculosis, 

66. Kit ou n6cessaire pour la detection de la presence 
d'une bactSrie du complexe Mycobacterium tuberculosis dans 
un echantillon biologique, caracterisS en ce qu'il comprend 
les elements suivants : 

a) une sonde oligonuclSotidique, dite sonde de capture, 
selon la revendication 40 ; 

b) une sonde oligonuclSotidique, dite sonde de relation, 
selon l'une des revendications 38 3 42 ; 

c) le cas echeant, un couple d' amorces selon l'une des 
revendications 35 a 37 ainsi que les reactifs nScessaires 
a une reaction d 1 amplification de 1 'ADN d'une bactSrie du 
complexe Mycobacterium tuberculosis. 

67. Kit pour 1' amplification de 1 'ADN d'une bactfirie du 
complexe Mycobacterium tuberculosis present dans un 

Echantillon biologique, caractfirisS en ce qu'il comprend 
les Pigments suivants : 

a) un couple d'amorces selon l'une des revendications 35 k 
37 ; 

b) les rSactifs nScessaires pour effectuer une reaction 
d» amplification d 1 ADN ; 

c) 6ventuellement un composant permettant de verifier la 
sequence du fragment amplififi, plus particulierement une 
sonde oligonucleotidique selon l'une des revendications 38 



35 a 42. 
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68. Composition immunogdne caract6ris€e en ce qu'elle 
comprend un ou plusieurs polypeptides selon l'une des 
revendications 26, 32, 33 et 47 et/ou un ou plusieurs 
polypeptides hybrides selon l'une des revendications 48, 4 9 

5 et 51. 

69. Vaccin caract6ris6 en ce qu f il contient un ou plusieurs 
polypeptides selon l'une des revendications 26, 32, 33 et 
47 et/ou un ou plusieurs polypeptides hybrides selon l'une 

10 des revendications 48 , 49 et 51 , en association avec un 
vehicule pharmaceutiquement compatible et, le cas 6ch6ant 
un ou plusieurs adjuvants de 1'immunite appropri6s. 

70. Vaccin destine a 1 1 immunisation a l'encontre d'une 
15 infection bacterienne ou virale, telle que la tuberculose 

ou l'hepatite, comprenant un vecteur selon la revendication 
43 ou un polynucleotide selon la revendication 50, en 
association avec un vShicule pharmaceutiquement acceptable. 

20 71. Vaccin caractSrise en ce qu'il contient une ou 
plusieurs sequences nucleotidiques selon l'une des 
revendications 20 a 24 et/ou un ou plusieurs 
polynucleotides selon la revendication 25 en association 
avec un vShicule pharmaceutiquement compatible et, le cas 

25 6ch§ant, un ou plusieurs adjuvants de l'immunite 
appropriSs . 

72. M6thode de criblage de molecules capables d'inhiber 
la croissance de mycobact6ries ou le maintien de 
30 mycobacteries dans un hote, caracteris6e en ce que lesdites 
molecules bloquent la synthese ou la fonction des 
polypeptides codes par une sequence nuclfiotidique selon 
l'une quelconque des revendications 20 a 24 ou par un 
polynucleotide selon la revendication 25. 

35 
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73. Methode de criblage selon la revendication 72, 
caracterisee en ce que les molecules sont des anti- 
tnessagers ou induisent la synthese d'anti-messagers. 

74. MolScules capables d'inhiber la croissance de 
mycobacteries ou le maintien de mycobacteries dans un h6te, 
caracterisees en ce que lesdites mol6cules sont 
synthetisees d'apres la structure des polypeptides codes 
par une sequence nucleotidique selon l'une quelconque des 
revendications 20 a 24 ou par un polynucleotide selon 

la revendication 25. 
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1 GGATCCCAGGGAACGTGACC ATG GTC GTA GGG ATG ACT TGA CAGTTTCAACGGGGTGCGACCACCGTTGCGC 72 
1 MVVGMT* y 
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P 


264 
47 


GTC 
V 


GCG 
A 


CAG 
Q 


CTT 
L 


TTT GGC 
F G 


GAC 
D 


324 
67 


CAC 
H 


CAC 
H 


ATA 
I 


CGG 
R 


CCG GTC 
P V 


CGG 
R 


384 
87 


CCC 
P 


AGG 
R 


CAG 
Q 


TTC 
F 


GCT GGC 
A G 


TAT 
Y 


444 
107 



445 TTG TCG CAG TAG CGCGACGGCATTGTCG ATG TCT TGG TAG CTAGCATCCGGTCGGGGGGCCGCTACCAGCG 515 
1UO l*bQ* M S W * 

4 

516 CCAGCGCCGGGGCTCCCCGGTCCGGGTAGTGCGCGTCGAGTTGGTCGTGGACCAGCA ATG ACT GCG ACC CGG 587 
1 M T A T R 5 



588 CGA 
6 R 


CTT 
L 


CGA 
R 


AAC 
N 


CGC 
R 


CAC 
H 


CGG 
R 


TTA 
L 


GAT 
D 


TCC 
5 


CCG 
P 


ACT 
T 


GCG TCA TCG CCA GGT AAA CCG CCG 
ASSPGKPP 


647 

25 


648 GCA 
26 A 


CTA 
L 


ACG 
T 


CCA 
P 


GCA 
A 


ACC 
T 


AAC 
N 


CCG 
P 


TGA 


AGACCAACCAACGGCACCTGCGCAGGTTGCGGCTCAACCGCATC 718 

34 


719 ATG 
1 M 


AAC 
N 


TGC 

C 


TGG 
W 


ATT 
I 


TCG 

S 


GAC 
D 


TCC 
S 


CCG 
P 


TAC 
Y 


TCT 

S 


CGC 
R 


GCA 
A 


GTG 
V 


CGT GCC CGC GAG CCT ACC 
R A R £ P T 


778 
20 


779 GAA 
21 E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC 
R 


ACA 

T 


GCA 
A 


CCT 
P 


GGA GTT GGC GGC GCC GAG 
G V G G A E 


838 
40 


839 GGC 
41 G 


CGA 
R 


GAT 
D 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG 
R 


GGG 
G 


CGG 
R 


GAA 
E 


CTC 
L 


CCA GGC CGC CGG ACC GTC 
P G R R T V 


398 
60 


899 GCA 
61 A 


AAC 
N 


CCG 
P 


TCG 
S 


CAA 
Q 


ACC 
T 


CGT 
R 


CGC 
R 


AAA 

K 


CCG 
P 


TAA 
* 


GGAGTCATCC ATG AAG ACA GGC ACC GCG 
M K T G T A 


959 

6 


960 ACG 
7 T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 
V 


CTG 
L 


ATC 
I 


GCC 
A 


CTC 
L 


GCG 
A 


TTG CCG GGG GCC GCC GTT 
L P G A A V 


1019 
26 


1020 GCG 
27 A 


CTG 
L 


CTG 
L 


GCC 
A 


GAA 
E 


CCA 
P 


TCA 

S 


GCG 
A 


ACC 
T 


GGC 
G 


GCG 
A 


TCG 
S 


GAC 
D 


CCG 
P 


TGC GCG GCC AGC GAA GTG 
C A A S E V 


1079 
46 


1080 GCG 
47 A 


AGG 
R 


ACG 
T 


GTC 
V 


GGT 
G 


TCG 
S 


GTC 
V 


GCC 
A 


AAG 
K 


TCG 
S 


ATG 
M 


GGC 
G 


GAC 
D 


TAC 
Y 


CTG GAT TCA CAC CCA GAG 
L D S H P E 


1139 
66 


1140 ACC 
67 T 


AAC 
N 


CAG 
Q 


GTG 
V 


ATG 
M 


ACC 
T 


GCG 
A 


GTC 
V 


TTG 
L 


CAG 
Q 


CAG 
Q 


CAG 
Q 


GTA 
V 


GGG 
G 


CCG GGG TCG GTC GCA TCG 
P G S V A S 


1199 
36 


1200 CTG 
87 L 


AAG 
K 


GCC 
A 


CAT 
H 


TTC 


GAG 
E 


GCG 
A 


AAT 
N 


CCC 
P 


AAG 
K 


GTC 
V 


GCA 

A 


TCG 

S 


GAT 
r) 


CC 


1243 
100 



SEQ ID N° 1 



FIGURE 1 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



2/185 



Insert du clone contenant DP428 et contenu dans seal 
1/1 31/11 



GAT CGC 


CTT 


TGA 


CGC 


CTA 


TTC 


GGT 


CGC 


ecu 


v*»r ^tt 


TGG 


CGA 


CGT 


CAC TGG TGC 


CCG 


CGT 


asp arg 
61/21 


leu 




arg 


leu 


pne 


gly 


arg 


ala 


ala phe 
oi /n . 

71/ Jl 


trp 


arg 


arg 


his trp cys 


pro 


arg 


TGC GGG 


CGT 


CCA 


GCC 


GCA 


GCG 


ACA 


CCA 


CAT 


ACG GCC 


GGT 


CCG 


GTT 


GCG GGG GCC 


GTT 


GGG 


cys giy 
121/41 


a r*rr 


pro 


al a 
aid 


al a 
did 


did 


tnr 


pro 


ms 


thr ala 

1 /CI 

151/51 


gly 


pro 


val 


ala gly ala 


val 


gly 


TGG GGT 


TGG 


GTG 


CCT 


CCG 


TCA 


CCC 


CAG 


GCA 


GTT CGC 


TGG 


CTA 


TTT 


GTC GCA GTA 


GCG 


CGA 


trp gly 


trp 


val 
Val 


pro 


pro 


ser 


pro 


gin 


ala 


val arg 


trp 


leu 


phe 


val ala val 


ala 


arg 


181/61 


















211/71 






CGG CAT 


TGT 


CGA 


TGT 


CTT 


GGT 


AGC 


TAG 


CAT 


CCG GTC 


GGG 


GGG 


CCG 


CTA CCA GCG 


CCA 


GCG 


arg his 


cys 


arg 


cys 


1 All 

leu 


gly 


ser 


AMB 


his 


pro val 


gly 


gly 


pro 


leu pro ala 


pro 


ala 


241/81 


















271/91 




cm czm 


„_ 

CTC 


ccc 


CJCT 


ccc 


box 


AGT 


GCG 


CGT 


CGA GTT 


GGT 


CGT 


GGA 


CCA GCA ATG 


ACT 


GCG 


pro yxy 


leu 


pro 


gly 


pro 


gly 


ser 


_ i 

ala 


arg 


arg val 


gly 


arg 


gly 


pro ala met 


thr 


ala 


101/101 


















331/111 




ACC CGG 


CGA 


CTT 


CGA 




CCjC 


pan 


CCS" 


1 1 A 


GAT TCC 


CCG 


ACT 


GCG 


TCA TCG CCA 


GGT 


AAA 


thr arg 

161/121 

Jvi/ li. X 


arg 


leu 


arg 


asn 


arg 


nis 


arg 


leu 


asp ser 
391/131 


pro 


thr 


ala 


ser ser pro 


gly 


lys 


CCG CCG 


GCA 










ALL. 


AAC 


CCG 


TGA AGA 


CCA 


ACC 


AAC 


GGC ACC TGC 


GCA 


GGT 


pro pru 
421 /141 

*l £. ±f X*I X 


al a 
ala 


leu 


tnr 


pro 


aia 


tnr 


asn 


pro 


OPA arg 
451/151 


pro 


thr 


asn 


gly thr cys 


ala 


gly 








uw\ 


tc a 


Tt*A 


ACT 


GCT 


GGA 


TTT CGG 


ACT 


CCC 


CGT 


ACT CTC GCG 


CAG 


TGC 


cys gly 

4fl1 /I 61 
VOX/ Xvl 


ser 


tnr 


ala 


ser 


OPA 


thr 


ala 


gly 


phe arg 
511/171 


thr 


pro 


arg 


thr leu ala 


gin 


cys 




cm 








AAl» 


HIV" 

ATC 


GCG 


TGC 


ATG CGT 


TCG 


GCG 


TGG 


ACC GCA CAG 


CAC 


CTG 


val pro 


aia 

ala 


ser 


leu 


pro 


1 no 

lys 


He 


_ -7 _ 

ala 


cys 


met arg 


ser 


ala 


trp 


thr ala gin 


his 


leu 


541/lftl 

JHf 191 


















571/191 








GAG TTG 


GCG 


GCG 


cm 




fZCC 




Alb 


GCA 


GGA TGA 


CGG 


ATC 


GTC 


GGG GGC GGG 


AAC 


TCC 


glu leu 


did 


al a 
did 


pro 


arg 


aia 


giu 


met 


ala 


gly OPA 


arg 


ile 


val 


gly gly gly 


asn 


ser 


601/201 


















oj 1/211 










CAG GCC 




own 


CCfl 






ALL. 


C&T 


CGC 


AAA CCC 


GTC 


GCA 


AAC 


CGT AAG GAG 


TCA 


TCC 


gin ala 


al a 
did 


gly 


pro 


ser 


gin 


tnr 


arg 


arg 


lys pro 


val 


ala 


asn 


arg lys glu 


ser 


ser 


661/221 


















691/231 










ATG AAG 


ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


AGG CTG 


TTG 


GCA 


GTA 


CTG ATC GCr 


CTC 


CCC 


met lys 


thr 


giy 


thr 


ala 


thr 


thr 


arg 


arg 


arg leu 


leu 


ala 


val 


leu ile ala 


leu 


ala 


721/241 


















751/251 










TTG CCG 


GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


GAA CCA 


TCA 


GCG 


ACC 


GGC GCG TCG 


GAC 


CCG 


leu pro 


gly 


ala 


ala 


val 


ala 


leu 


leu 


ala 


glu pro 


ser 


ala 


thr 


gly ala ser 


asp 


pro 


781/261 


















811/271 








TGC GCG 


GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


GTC 


GGT TCG 


GTC 


GCC 


AAG 


TCG ATG GGC 


GAC 


TAC 


cys ala 


ala 


ser 


glu 


val 


ala 


arg 


thr 


val 


gly ser 


val 


ala 


lys 


ser met gly 


asp 


tyr 


841/281 


















871/291 








CTG GAT 


TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG ACC 


GCG 


GTC 


TTG 


CAG CAG CAG 


GTA 


GGG 


leu asp 


ser 


his 


pro 


glu 


thr 


asn 


gin 


val 


met thr 


ala 


val 


leu 


gin gin gin 


val 


gly 


901/301 


















931/311 










CCG GGG 


TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


CCC 


AAG GTC GCA 


TCG 


GAT C 


pro gly 


ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


phe glu 


ala 


asn 


pro 


lys val ala 


ser 


asp 



SEQ ID N° 1A' 
FIGURE 1A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



3/185 



Insert du clone contenant DP428, autre phase de lecture 



2/1 


















32/11 
















ATC GCC 


TTT 


GAC 


GCC 


TAT 


TCG 


GTC 


GCG 


CAG 


CTT TTT GGC 


GAC 


GTC 


ACT 


GGT 


GCC 


CGC 


GTT 


ile ala 
62/21 


phe 


asp 


ala 


tyr 


ser 


val 


ala 


gin 


leu phe gly 
92/31 


asp 


val 


thr gly 


ala 


arg 


val 


GCG GGC 


GTC 


CAG 


CCG 


CAG 


CGA 


CAC 


CAC 


ATA 


CGG CCG GTC 


CGG 


TTG 


CGG 


GGG 


CCG 


TTG 


GGT 


ala gly 
122/41 


val 


gin 


pro 


gin 


arg 


his 


his 


ile 


arg pro val 
152/51 


arg 


leu 


arg 


gly 


pro 


leu gly 


GGG GTT 


GGG 


TGC 


CTC 


CGT 


CAC 


CCC 


AGG 


CAG 


TTC GCT GGC 


TAT 


TTG 


TCG CAG 


TAG 


CGC 


GAC 


gly val 
182/61 


gly 


cys 


leu 


arg 


his 


pro 


arg 


gin 


phe ala gly 
212/71 


tyr leu 


ser 


gin 


AMB 


arg 


asp 


GGC ATT 


GTC 


GAT 


GTC 


TTG 


GTA 


GCT 


AGC 


ATC 


CGG TCG GGG 


GGC 


CGC 


TAC 


CAG 




CAG 


CGC 


gly ile 
242/81 


val 


asp 


val 


leu 


val 


ala 


ser 


ile 


arg ser qly 
272/91 


gly 


arg 


tyr 


gin 


arg 


gin arg 


CGG GGC 


TCC 


CCG 


GTC 


CGG 


GTA 


GTG 


CGC 


GTC 


GAG TTG GTC 


GTG 


GAC 


CAG 


CAA 


TGA 


CTG 


CGA 


arg gly 


ser 


pro 


val 


arg 


val 


val 


arg 


val 


glu leu val 


val 


asp 


gin qln 


OPA 


leu 


arg 


302/101 


















332/111 












CCC GGC 


GAC 


TTC 


GAA 


ACC 


GCC 


ACC 


GGT 


TAG 


ATT CCC CGA 


CTG 


CGT 


CAT 


CGC 


CAG 


GTA AAC 


pro gly 
362/121 


asp 


phe 


glu 


thr 


ala 


thr gly 


AMB 


ile pro arg 
392/131 


leu 


arg 


his 


arg 


gin 


val 


asn 


CGC CGG 


CAC 


TAA 


CGC 


CAG 


CAA 


CCA 


ACC 


CGT 


GAA GAC CAA 


CCA 


ACG 


GCA 


CCT 


GCG 


CAG 


GTT 


arg arg 


his 


OCH 


arg 


gin 


gin 


pro 


thr 


arg 


glu asp gin 


pro 


thr 


ala 


pro 


old 


gin val 


422/141 


















452/151 














GCG GCT 


CAA 


CCG 


CAT 


CAT 


GAA 


CTG 


CTG 


GAT 


TTC GGA CTC 


CCC 


GTA 


CTC 


TCG 


CGC 


AGT 


GCG 


ala ala 


gin 


pro 


his 


his 


glu 


leu 


leu 


asp 


phe gly leu 


pro 


val 


leu 


ser 


arg 


ser 


ala 


482/161 


















512/171 








TGC CCG 


CGA 


GCC 


TAC 


CGA 


AGA 


TCG 


CGT 


GCA 


TGC GTT CGG 


CGT 


GGA 


CCG 


CAC 


AGC 


ACC 


TGG 


cys pro 


arg 


ala 


tyr 


arg 


arg 


ser 


arg 


ala 


cys val arg 


arg gly 


pro 


his 


ser 


thr 


trp 


542/181 


















572/191 












AGT TGG 


CGG 


CGC 


CGA 


GGG 


CCG 


AGA 


TGG 


CAG 


GAT GAC GGA 


TCG 


TCG 


GGG 


GCG 


GGA 


ACT 


CCC 


ser trp 


arg 


arg 


arg 


gly 


pro 


arg trp 


gin 


asp asp gly 


ser 


ser 


gly ala 


crlv 


thr 


pro 


602/201 




- 














632/211 












AGG CCG 


CCG 


GAC 


CGT 


CGC 


AAA 


CCC 


GTC 


GCA 


AAC CCG TCG 


CAA 


ACC 


GTA 


AGG 


AGT 


CAT 


CCA 


arg pro 


pro 


asp 


arg 


arg 


lys 


pro 


val 


ala 


asn pro ser 


gin 


thr 


val 


arg 


ser 


his 


pro 


662/221 


















692/231 








TGA AGA 


CAG 


GCA 


CCG 


CGA 


CGA 


CGC 


GGC 


GCA 


GGC TGT TGG 


CAG 


TAC 


TGA 


TCG 


CCC 


TCG 


CGT 


OPA arg 


gin 


ala 


pro 


arg 


arg 


arg gly 


ala 


gly cys trp 


gin tyr 


OPA 


ser 


pro 


ser 


arg 


722/241 


















752/251 












TGC CGG 


GGG 


CCG 


CCG 


TTG 


CGC 


TGC 


TGG 


CCG 


AAC CAT CAG 


CGA 


CCG 


GCG 


CGT 


CGG 


ACC 


CGT 


cys arg 
782/261 


gly 


pro 


pro 


leu 


arg 


cys 


trp 


pro 


asn his gin 
812/271 


arg 


pro 


ala 


arg 


arg 


thr 


arg 


GCG CGG 


CCA 


GCG 


AAG 


TGG 


CGA 


GGA 


CGG 


TCG 


GTT CGG TCG 


CCA AGT 


CGA 


TGG 


GCG 


ACT 


ACC 


ala arg 


pro 


ala 


lys 


trp 


arg 


gly arg 


ser 


val arg ser 


pro 


ser 


arg 


trp 


ala 


thr 


thr 


842/281 


















872/291 










TGG ATT 


CAC 


ACC 


CAG 


AGA 


CCA 


ACC AGG 


TGA 


TGA CCG CGG 


TCT 


TGC 


AGC 


AGC 


AGG 


TAG 


GGC 


trp ile 


his 


thr 


gin 


arg 


pro 


thr 


arg 


OPA 


OPA pro arg 


ser 


cys 


ser 


ser 


arg 


AM3 


gly 


902/301 


















932/311 












CGG GGT 


CGG 


TCG 


CAT 


CGC 


TGA 


AGG 


CCC 


ATT 


TCG AGG CGA 


ATC 


CCA 


AGG 


TCG 


CAT 


CGG 


ATC 


arg gly 


arg 


ser 


his 


arg 


OPA 


arg 


pro 


ile 


ser arg arg 


ile 


pro 


arg 


ser 


his 


arg 


ile 



SEQ ID N° IB 1 
FIGURE IB 1 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



4/185 



SeqlC: Insert du clone DP428, autre ph. 
3/1 



TCG CCT TTG 


ACG 


CCT 


ATT 


CGG 


TCG 


CGC 


AGC 


ser pro leu 


thr 


pro 


ile 


aro 


ser 


arg 


ser 


63/21 












CGG GCG TCC 


AGC 


CGC 


AGC 


GAC 


ACC 


ACA 


TAC 


arg ala ser 


ser 


arg 


ser 


aso 
****** 


thr 


thr 


tyr 


123/41 














GGG TTG GGT 


GCC 


TCC 


GTC 


ACC 


CCA 


GGC 


AGT 


gly leu gly ala 


ser 


val 


thr 


pro 


gly 




183/61 












GCA TTG TCG 


ATG 


TCT 


TGG 


TAG 


CTA 


GCA 


TCC 


ala leu ser 


met 


ser 


trD 


AMB 


leu 


ala 


ear 


243/81 














GGG GCT CCC 


CGG 


TCC 


GGG 


TAG 


TGC 


GCG 


TCG 


gly ala pro 


arg 


ser 


olv 


AMB 


cys 


ala 


ser 


303/101 














CCG GCG ACT 


TCG 


AAA 


CCG 


CCA 


CCG 


GTT 




pro ala thr 


ser 


lvs 


pro 


XT*- v 


pro 


val 


arg 


363/121 














GCC GGC ACT 


AAC 


GCC 


AGC 


AAC 


CAA 


CCC 


GTG 


ala gly thr 


asn 


ala 


ser 


asn 


gin 


pro 


val 


423/141 












CGG CTC AAC 


CGC 


ATC 


ATG 


AAC 


TGC 


TGG 


ATT 


arg leu asn 


arg 


ile 


met 


asn 




trp 


ile 


483/161 












GCC CGC GAG 


CCT 


ACC 


GAA 


GAT 


CGC 


GTG 


CAT 


ala arg glu pro 


thr 


alu 


asD 


arg 


val 


his 


543/181 














GTT GGC GGC 


GCC 


GAG 


GGC 


CGA 


GAT 


GGC 


AGG 


val gly gly ala 


glu 


glv 


arg 


asp 


gly 


arg 


603/201 










GGC CGC CGG ACC 


GTC 


GCA 


AAC 


CCG 


TCG 


CAA 


gly arg arg thr 


val 


ala 


asn 


pro 


ser 


gin 


663/221 












GAA GAC AGG 


CAC 


CGC 


GAC 


GAC 


GCG 


GCG 


CAG 


glu asp arg 


his 


arg 


asp 


asp 


ala 


ala 


gin 


723/241 














GCC GGG GGC 


CGC 


CGT 


TGC 


GCT 


GCT 


GGC 


CGA 


ala gly gly arg 


arg 


cys 


ala 


ala 


gly 


arg 


783/261 












CGC GGC CAG 


CGA 


AGT 


GGC 


GAG 


GAC 


GGT 


CGG 


arg gly gin 


arg 


ser 


gly 


glu 


asp 


gly 


arg 


843/281 










GGA TTC ACA 


CCC 


AGA 


GAC 


CAA 


CCA 


GGT 


GAT 


gly phe thr pro 


arg 


asp 


gin 


pro 


gly 


asp 


903/301 












GGG GTC GGT 


CGC 


ATC 


GCT 


GAA 


GGC 


CCA 


TTT 


gly val gly 


arg 


ile 


ala 


glu 


gly 


pro 


phe 



de lecture 



33/11 


















TTT TTG 


GCG 


ACG 


TCA 




\3X\J 




GCG 


TTG 


phe leu 


ala 


thr 


ser 


leu 


val 


pro 


ala 
<3J.cx 


leu 


93/31 
















GGC CGG 


TCC 


GGT 


TGC 






CGT 


TGG 


GTG 


gly arg 


ser 


gly cys 




gxy 


a jl y 


trp 


vax 


153/51 














TCG CTG 


GCT 


ATT 


TGT 




AG1 


AGC 


GCG 


ACG 


ser leu 


ala 


lie 


cys 


a rg 


ear 


ser 


axa 


enr 


213/71 
















GGT CGG 

A WWW 


GGG 


GCC 


GCT 




AGC 


GCC 


AGC 


GCC 


gly arg 


Ql V 


ala 


ala 


thr 




Ala 
aid 


ser 


axa 


273/91 


















AGT TGG 


X 1*1? 


TGG 


ACC 


AGL- 


AAT 


GAC 


TGC 


GAC 


ser trp 


ser 


trp 


thr 


oar 
act 


asn 


asp 


cys 


asp 


333/111 














ttc rrr 




TGC 


GTC 


ATC 


GCC 


AGG 


TAA 


ACC 


phe oro 


asp 


cys 


val 


lie 


axa 


arg 


OCH 


thr 


393/131 
















AAG Arc 




CAA 


CGG 


CAC 


CTG 


CGC 


AGG 


TTG 


lys thr 


asn 


gin 


arg 


his 


leu 


arg 


arg 


leu 


453/151 














TCG GAC 


X v*u 


CCG 


TAC 


TCT 


CGC 


GCA 


GTG 


CGT 


ser asp 




pro 


tyr 


ser 


arg 


ala 


val 


arg 


513/171 














GCG TTC 


GGC 


GTG 


GAC 


CGC 


ALIA 


GCA 


CCT 


GGA 


ala Dhe 


y xy 


val 


asp 


arg 


till 


axa 


pro gly 


573/191 


















ATG ACG 


GAT 


CGT 


CGG 


GGG 


v~GG 


GAA 


CTC 


CCA 


met thr 


asD 


arg arg gly 


arg 


glu 


leu 


pro 


633/211 
















ACC CGT 


CGC 


AAA 


CCG 


TAA 




GI C 


ATC 


CAT 


thr arg 


arg 


lys 


pro 


OCH 


gxy 


Val 


ile 


his 


693/231 
















GCT GTT 


GGC 


AGT 


ACT 


GAT 


1*(jC 


CCT 


CGC 


GTT 


ala val 


al v 


ser 


thr 


asp 


d l. y 


pro 


arg 


val 


753/251 
















ACC ATC 


AGC 


GAC 


CGG 


CGC 


GTC 


GGA 


CCC 


GTG 


thr ile 


ser 


asp 


arg 


arg 


val 


gly 


pro 


val 


813/271 














TTC GGT 


CGC 


CAA 


GTC 


GAT 


GGG 


CGA 


CTA 


CCT 


phe gly 


arg 


gin val 


asp 


gly 


arg 


leu 


pro 


873/291 












GAC CGC 


GGT 


CTT 


GCA 


GCA 


GCA 


GGT 


AGG 


GCC 


asp arg 


gly 


leu 


ala 


ala 


ala 


gly 


arg 


ala 


933/311 














CGA GGC 


GAA 


TCC 


CAA 


GGT 


CGC 


ATC 


GGA 


TC 


arg gly 


glu 


ser 


gin 


gly 


arg 


ile 


gly 





SEQ ID N° 1C 
FIGURE 1C 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



5/185 

Sequence codante DP428 identique a la sequence Rv0203 predite par Cole et al 
(Nature 393:537-544) 

1/1 31/11 
ATG AAG 
Met lys 
61/21 
TTG CCG 
leu pro 
121/41 
TGC GCG 
cys ala 
181/61 
CTG GAT 
leu asp 
241/81 
CCG GGG 
pro gly 
301/101 
CTG CAC 
leu his 
361/121 



ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 




TTG 


GCA 


GTA 


CTG 


ATC 


thr gly 


thr 


ala 


thr 


thr 


ara 


a rg 


a m 1 a it 


leu 


aia 


val 


leu 


ile 


















91/31 










GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 




I CA 


GCG 


ACC 


GGC 


GCG 


gly ala 


ala 


val 


ala 


leu 


leu 


ala 

alt* 


/-fill n r n 

yxu pro 


ser 


ala 


thr 


gly 


ala 


















151/51 










GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


v 


w 1 1 v*vj 


c»rc 


GCC 


AAG 


TCG 


ATG 


ala 


ser 


glu val 


ala 


arg 


thr 


vax 


gly ser 


val 


ala 


lys 


ser 


met 


















211/71 










TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG ACC 


GCG 


GTC 


TTG 


CAG 


CAG 


ser 


his 


pro glu 


thr 


asn 


gin 


val 


met thr 


ala 


val 


leu 


gin 


gin 


















271/91 








TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


ccc 


AAG 


GTC 


ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


phe glu 


ala 


asn 


pro 


lys 


val 


















331/111 










GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT TCG 


ACT 


CGG 


TGC 


TCG 


CTG 


ala 


leu 


ser 


gin 


pro 


leu 


thr 


asp 


leu ser 


thr 


arg 


cys 


ser 


leu 


















391/131 








CAG 


GCG 


ATC 


GGT 


TTG 


ATG 


CAG 


GCG 


GTG CAG 


GGC 


GCC 


CGC 


CGG 


TAG 


gin ala 


ile gly 


leu 


met 


gin 


ala 


val gin 


gly 


ala 


arg 


arg 


AMB 














SEQ ID N° ID 













FIGURE ID 



ORF contenant la sequence DP428 et fais 
1/1 



TGA CGG 


ATC 


GTC 


GGG 


GGC 


GGG 


AAC 


TCC 


CAG 


OPA arg 


ile 


val 


gly 


gly 


gly 


asn 


ser 


gin 


61/21 
















CCC GTC 


GCA 


AAC 


CGT 


AAG 


GAG 


TCA 


TCC 


ATG 


pro val 


ala 


asn 


arg 


lys 


glu 


ser 


ser 


met 


121/41 


















CTG TTG 


GCA 


GTA 


CTG 


ATC 


GCC 


CTC 


GCG 


TTG 


leu leu 


ala 


val 


leu 


ile 


ala 


leu 


ala 


leu 


181/61 


















CCA TCA 


GCG 


ACC 


GGC 


GCG 


TCG 


GAC 


CCG 


TGC 


pro ser 


ala 


thr 


gly 


ala 


ser 


asp 


pro 


cys 


241/81 
















TCG GTC 


GCC 


AAG 


TCG 


ATG 


GGC 


GAC 


TAC 


CTG 


ser val 


ala 


lys 


ser 


met 


gly 


asp 


tyr 


leu 


301/101 


















ACC GCG 


GTC 


TTG 


CAG 


CAG 


CAG 


GTA 


GGG 


CCG 


thr ala 


val 


leu 


gin 


gin 


gin 


val 


gly 


pro 


361/121 


















GAG GCG 


AAT 


CCC 


AAG 


GTC 


GCA 


TCG 


GAT 


CTG 


glu ala 


asn 


pro 


lys 


val 


ala 


ser 


asp 


leu 


421/141 
















TCG ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC 


GGC 


ser thr 


arg 


cys 


ser 


leu 


pro 


ile 


ser 


gly 


481/161 
















CAG GGC 


GCC 


CGC 


CGG 


TAG 










gin gly 


ala 


arg 


arg 


AMB 











SEQ 



partie de seqlA' 



3i/n 


















GCC GCC 


GGA 


CCG 


TCG 


CAA 


ACC 


CGT 


CGC 


AAA 


ala ala 


gly 


pro 


ser 


gin 


thr 


arg 


arg 


lys 


91/31 














AAG ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


AGG 


lys thr 


gly 


thr 


ala 


thr 


thr 


arg 


arg 


arg 


151/51 












CCG GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


GAA 


pro gly 


ala 


ala 


val 


ala 


leu 


leu 


ala 


glu 


211/71 
















GCG GCC 


AGC 


GAA 


GTG 


GCG 


AGG. 


ACG 


GTC 


GGT 


ala ala 


ser 


glu 


val 


ala 


arg 


thr 


val 


gly 


271/91 














GAT TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG 


asp ser 


his 


pro 


glu 


thr 


asn 


gin 


val 


met 


331/111 
















GGG TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC 


gly ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


phe 


391/131 














CAC GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT 


his ala 


leu 


ser 


gin 


pro 


leu 


thr 


asp 


leu 


451/151 














CTG CAG 


GCG 


ATC 


GGT 


TTG 


ATG 


CAG 


GCG 


GTG 


leu gin 


ala 


ile 


gly 


leu 


met 


gin 


ala 


val 



N° IF 



FEUILLE DE REM^E^ElgEillf (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



6/185 



491 
1 

564 GAC CAG CAA TGA 
8 D Q Q * 



TACCAGCGCCAGCGCCGGGGCTCCCCGGTCCGGGTA GTG CGC GTC GAG TTG GTC GTG 563 

VRVELVV7 



ACTTCGAAACCGCCACCGGTTAGATTCCCCGACTGCGTCA' 



iTCc| xaVGGT 



AA 639 



640 ACCGCCGGCACTAACGCCAGCAACCAACCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG CGG 705 
1 V KTNQRHL RRLR 12 



706 
13 


CTC 
L 


AAC 
N 


CGC 
R 


ATC 
I 


ATG 
M 


AAC 
N 


TGC 

C 


TGG 
W 


ATT 
I 


TCG 
S 


GAC 
D 


TCC 
S 


CCG 
P 


TAC 
Y 


TCT CGC GCA GTG CGT GCC 
S R A V R A 


765 
32 


766 
33 


CGC 
R 


GAG 
E 


CCT 
P 


ACC 
T 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC ACA GCA CCT GGA GTT 
R T A P G V 


825 
52 


826 
53 


GGC 
G 


GGC 
G 


GCC 
A 


GAG 
E 


GGC 
G 


CGA 
R 


GAT 
D 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG 
R ' 


GGG CGG GAA CTC CCA GGC 
G R E L P G 


885 
72 


886 
73 


CGC 
R 


CGG 
R 


ACC 
T 


GTC 

V 


GCA 
A 


AAC 
N 


CCG 
P 


TCG 
S 


CAA 
Q 


ACC 
T 


CGT 
R 


CGC 
R 


AAA 

K 


CCG 
P 


TAA GGAGTCATCC ATG AAG 
* xxxxxx M K 


94 6 

2 


947 
3 


ACA 
T 


GGC 
G 


ACC 
T 


GCG 
A 


ACG 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 
V 


CTG 
L 


ATC GCC CTC GCG TTG CCG 
I A L A L P 


1006 

22 



1007 GGG GCC GCC GTT GO 5 
23 G A A V A 



CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG 1066 
L L A E PSATGA S D P C A 42 



1067 GCC AGC GAA GTG GCfi AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT 11*6 

43ASEVARTVG SVAKSMGDY LP 62~ 

1127 TCA CAC CCA GAG ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG 1186 

63SHPETNQVMTAVLQQQVG PG 82 

1187 TCG GTC GCA TCG CTG AAG GCC CAT TTC GAG GCG- AAT CCC AAG GTC GCA TCG GAT CTG CAC 1246 

83SVASLKAH FEAMPKV-AS DLH 102 

1247 GCG CTT TCG CAA CCG CTG ACC GAT CTT TCG ACT CGG TGC TCG CTG CCG ATC AGC GGC CTG 13C6 

103ALSQPLTDLSTRCS[LPI S |G j L 122 

1307 CAG GCG ATC GGT TTG ATG CAG GCG GTG CAG GGC GCC CGC CGG TAG ATG CCG GAC CGC CGC 1356 

123 QAI GLMQAVQGARR] * M P D R R 5 

1357 CGG GTC CGG CGC AGT CGA CGT GAG GCA GCG GTC GCC TAC CGG GGC GGT GTC TCG CCG CCT 14">6 

6RVRRSRREAAVAYRGGVSPP 25~ 

1427 TCT GGT CGC AGG TCA GGG GTC GGC GCT GGA CCT TGC GGT GTG GTT TCG ACC GGG TCG TCG 1436 

26SGRRSGVGAG PCGVVSTG S S 45 

1437 CAG GGT GTG CCC TGC GGT TGG ATG ACA AGT CGC AGG TTT GGA TCG GTT GGC GGG TCG CGA 1546 

46QGVPCGWMTSRRFGSVGGSR 65 



1547 TCG TTG T 
66 S L 



1553 
67 



SEQ ID N° 2 



FIGURE 2 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PC7YFR98/01813 



7/185 



TCG CCG GCT CGC 
ser pro ala arg 
61/21 

TGA CTG CCG GGC 
OPA leu pro gly 
121/41 

TGA CCT GGG GTG 
OPA pro gly val 
18.1/61 

CTC GGT CGC CGG 
leu qly arq arq 
241/81 

TCG TGG TTG CGA 

ser trp leu arg 

301/101 

GAT C 

asp 



GGA CGT AGA TAA 
gly arg arg OCH 

TTG ACG CGG ACG 
leu thr arg thr 

CGT GGG CGC CGA 
arg gly arg arg 

CAG TGT CAG CAT 
qln cys gin his 

CGA CTT GGC GCT 
arg leu gly ala 







Ol/ 11 


•rap 




ACC GTT 


AMB 


leu 


i. ill. va X 






91/31 


ACC 


ACA 


GAG TCG 


thr 


thr 


glu ser 






151/51 


CGA 


GTG 


AGG CAG 


arg 


val 


arg gin 






211/71 


GTG 


CAG 


ATG ACT 


val 


gin 


met thr 






271/91 


GGT 


GAG 


CGC ACC 


gly 


glu 


arg thr 



GGA CGA CCT CGA 
gly arg pro arg 

GGT CAT CGC CTA 
gly his arg leu 

TCA TGT CTC AGG 
ser cys leu arg 

CCA CGC AGC TTG 
pro arg ser leu 

CGC CGG CGT CGT 
arg arg arg arg 



CAG 


GGT 


CCT 


TTG 


gin 


gly 


pro 


leu 


AGG 


CTA 


CCG 


TTC 


arg 


leu 


pro phe 


GCC 


CAC 


CGC 


CAC 


ala 


his 


arg 


his 


TTC 


GTG 


TTG 


GTG 


phe 


val 


leu 


val 


GCC 


GCG 


CAT 


GCG 


ala 


ala 


his 


ala 



SEQ ID N° 3A 



FIGURE 3A 



CGC CGG CTC GCG 
arg arg leu ala 
62/21 

GAC TGC CGG GCT 
asp cys arg ala 
122/41 

GAC CTG GGG TGC 
asp leu gly cys 
182/61 

TCG GTC GCC GGC 
ser val ala gly 
242/81 

CGT GGT TGC GAC 

arg gly cys asp 

302/101 

ATC 

ile 



GAC GTA GAT AAT 
asp val asp asn 

TGA CGC GGA CGA 
OPA arg gly arg 

GTG GGC GCC GAC 
val gly ala asp 

AGT GTC AGC ATG 
ser val ser met 

GAC TTG GCG CTG 
asp leu ala leu 







32/11 


AGC 


TCA 


CCG TTG 


ser 


ser 


pro leu 






92/31 


CCA 


CAG 


AGT CGG 


pro 


gin 


ser arg 






152/51 


GAG 


TGA 


GGC AGT 


glu 


OPA 


gly ser 






212/71 


TGC 


AGA 


TGA CTC 


cys 


arg 


OPA leu 






272/91 


GTG 


AGC 


GCA CCC 


val 


ser 


ala pro 



GAC GAC CTC GAC 
asp asp leu asp 

GTC ATC GCC TAA 
val ile ala OCH 

CAT GTC TCA GGG 
his val ser gly 

CAC GCA GCT TGT 
his ala ala cys 

GCC GGC GTC GTG 
ala gly val val 



AGG 


GTC 


CTT 


TGT 


arg 


val 


leu 


cys 


GGC 


TAC 


CGT 


TCT 


gly 


tyr 


arg 


ser 


CCC 


ACC 


GCC 


ACC 


pro 


thr 


ala 


thr 


TCG 


TGT 


TGG 


TGT 


ser 


cys 


trp 


cys 


CCG 


CGC 


ATG 


CGG 


pro 


arg 


met 


arg 



SEQ ID N° 3B 
FIGURE 3B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



8/185 



GCC GGC TCG CGG ACG 
ala gly ser arg thr 
63/21 

ACT GCC GGG CTT GAC 
thr ala gly leu asp 
123/41 

ACC TGG GGT GCG TGG 
thr trp gly ala trp 
183/61 

CGG TCG CCG GCA GTG 
arg ser pro ala val 
243/81 

GTG GTT GCG ACG ACT 
val val ala thr thr 

TC 



TAG ATA ATA GCT CAC 
AMB ile ile ala his 

GCG GAC GAC CAC AGA 
ala asp asp his arg 

GCG CCG ACG AGT GAG 
ala pro thr ser glu 

TCA GCA TGT GCA GAT 
ser ala cys ala asp 

TGG CGC TGG TGA GCG 
trp arg trp OPA ala 



33/11 

CGT TGG ACG ACC TCG 
arg trp thr thr ser 
93/31 

GTC GGG TCA TCG CCT 
val gly ser ser pro 
153/51 

GCA GTC ATG TCT CAG 
ala val met ser gin 
213/71 

GAC TCC ACG CAG CTT 
asp ser thr gin leu 
273/91 

CAC CCG CCG GCG TCG 
his pro pro ala ser 



ACA 


GGG 


TCC 


TTT 


GTG 


thr gly 


ser 


phe val 


AAG 


GCT 


ACC 


GTT 


CTG 


lys ala 


thr 


val 


leu 


GGC 


CCA 


CCG 


CCA 


CCT 


gly 


pro 


pro 


pro 


pro 


GTT 


CGT 


GTT 


GGT 


GTC 


val 


arg 


val 


gly 


val 


TGC 


CGC 


GCA 


TGC 


GGA 


cys 


arg 


ala 


cys 


gly 



SEQ ID N° 3C 
FIGURE 3C 



CCA ATT TTC CTT CGC GCC GTG 

pro ile phe leu arg ala val 
61/21 

GTC GCG CAG CTT GCG GAA ACC 

val ala gin leu ala glu thr 
121/41 

CGT CGC TCT CCA CCC GTC GGG 

arg arg ser pro pro val gly 
181/61 

GGC TGA GTG TCT GCA GGG CTC 

gly OPA val ser ala gly leu 
241/81 

GTC CCC CGC GCG CGA CTT CCA 

val pro arg ala arg leu pro 
301/101 

CAT TTC GCA GCA ACC GGT CTC 

his phe ala ala thr gly leu 
361/121 

CGG ACG AGT CGT CGT CAA CGA 

arg thr ser arg arg gin arg 







31/11 




CAA TAC 


CAT 


CTG CAA 


GAC 


gin tyr 


his 


leu gin 


asp 






91/31 




GGG TAT 


GGA 


CCC TGC 


CGT 


gly tyr 


gly 


pro cys 


arg 






151/51 




GGG CGA 


AAG 


CCA TTC 


CGA 


gly arg 


lys 


pro phe 


arg 






211/71 




CGG GGA 


GCA 


GCC GAT 


CAT 


arg gly 


ala 


ala asp 


his 






271/91 




GAC ATT 


TGT 


TGT GGT 


TTC 


asp ile 


cys 


cys gly 


phe 






331/111 




CGG GTC 


GCA 


GCA TCG 


TTG 


arg val 


ala 


ala ser 


leu 



CCA CGA TC 
pro arg 



SEQ ID N° 4A 
FIGURE 4A 



CAG 


CGA 


CGG 


CCC 


GTG 


GTT 


GCG 


gin 


arg 


arg 


pro 


val 


val 


ala 


ACC 


GTT 


GTT 


GCC 


ACT 


TGA 


TGT 


thr 


val 


val 


ala 


thr 


OPA 


cys 


CAC 


TGG 


GAT 


CCT 


CAA 


AAC 


GTC 


his 


trp 


asp 


pro 


gin 


asn 


val 


CAC 


CAT 


GTA 


CGA 


ACT 


GAA 


TAA 


his 


his 


val 


arg 


thr 


glu OCH 


GGT 


TGA 


GGC 


CGA 


GGC 


GAG 


GCT 


gly OPA 


gly 


arg 


gly 


glu 


ala 


CGG 


CGA 


TCG 


CGG 


CGC 


AGT 


CGT 


arg 


arg 


ser 


arg 


arg 


ser 


arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



9/185 



uft/\ 111 




1 1 C 


GCG 


CCG 


TGC 


gin phe 


ser 


pne 


ala 


pro 


cys 


oZ/21 












TCG CGC 


AGC 


TTG 


CGG 


AAA 


CCG 


ser arg 


ser 


leu 


arg lys 


pro 


1««/ 41 












GTC GCT 


CTC 


CAC 


CCG 


TCG 


GGG 


Vdl ala 


leu 


his 


pro 


ser 


gly 


182/61 










GCT GAG 


TGT 


CTG 


CAG 


GGC 


TCC 


ala glu 


cys 


leu 


gin gly 


ser 


242/81 












TCC CCC 


GCG 


CGC 


GAC 


TTC 


CAG 


ser pro 


ala 


arg 


asp phe 


gin 


302/101 












ATT TCG 


CAG 


CAA 


CCG 


GTC 


TCC 


ile ser 


gin 


gin 


pro 


val 


ser 


362/121 










GGA CGA 


GTC 


GTC 


GTC 


AAC 


GAC 


gly arg 


val 


val 


val 


asn 


asp 









32/11 




AAT 


ACC 


ATC 


TGC AAG 


ACC 


asn 


thr 


ile 


cys lys 


thr 








92/31 




GGT 


ATG 


GAC 


CCT GCC 


GTA 


gly 


met 


asp 


pro ala 


val 








152/51 




GGC 


GAA 


AGC 


CAT TCC 


GAC 


gly 


glu 


ser 


his ser 


asp 








212/71 


GGG 


GAG 


CAG 


CCG ATC 


ATC 


gly 


glu 


gin 


pro ile 


ile 








272/91 




ACA 


TTT 


GTT 


GTG GTT 


TCG 


thr 


phe 


val 


val val 


ser 








332/111 




GGG 


TCG 


CAG 


CAT CGT 


TGC 


gly 


ser 


gin 


his arg 


cys 


CAC 


GAT 


C 






his 


asp 









SEQ ID N° 4B 
FIGURE 4B 



AGC GAC GGC CCG TGG TTG CGG 
ser asp gly pro trp leu arg 

CCG TTG TTG CCA CTT GAT GTC 
pro leu leu pro leu asp val 

ACT GGG ATC CTC AAA ACG TCG 
thr gly ile leu lys thr ser 

ACC ATG TAC GAA CTG AAT AAG 
thr met tyr glu leu asn lys 

GTT GAG GCC GAG GCG AGG CTC 
val glu ala glu ala arg leu 

GGC GAT CGC GGC GCA GTC GTC 
gly asp arg gly ala val val 





















33/11 








AAT TTT 


CCT 


TCG 


CGC 


CGT 


GCA 


ATA 


CCA 


TCT 


GCA AGA 


CCA 


GCG 


ACG 


asn phe 


pro 


ser 


arg 


arg 


ala 


ile 


pro 


ser 


ala arg 


pro 


ala 


thr 


63/21 


















93/31 






CGC GCA 


GCT 


TGC 


GGA 


AAC 


CGG 


GTA 


TGG 


ACC 


CTG CCG 


TAC 


CGT 


TGT 


arg ala 


ala 


cys 


gly 


asn 


arg 


val 


trp 


thr 


leu pro 


tyr 


arg 


cys 


123/41 


















153/51 


TCG CTC 


TCC 


ACC 


CGT 


CGG 


GGG 


GCG 


AAA 


GCC 


ATT CCG 


ACA 


CTG 


GGA 


ser leu 


ser 


thr 


arg 


arg 


gly 


ala 


lys 


ala 


ile pro 


thr 


leu 


gly 


183/61 


















213/71 






CTG AGT 


GTC 


TGC 


AGG 


GCT 


CCG 


GGG 


AGC 


AGC 


CGA TCA 


TCA 


CCA 


TGT 


leu ser 


val 


cys 


arg 


ala 


pro 


gly 


ser 


ser 


arg ser 


ser 


pro 


cys 


243/81 


















273/91 




CCC CCG 


CGC 


GCG 


ACT 


TCC 


AGA 


CAT 


TTG 


TTG 


TGG TTT 


CGG 


TTG 


AGG 


pro pro 


arg 


ala 


thr 


ser 


arg 


his 


leu 


leu 


trp phe 


arg 


leu 


arg 


303/101 


















333/111 




TTT CGC 


AGC 


AAC 


CGG 


TCT 


CCG 


GGT 


CGC 


AGC 


ATC GTT 


GCG 


GCG 


ATC 


phe arg 


ser 


asn 


arg 


ser 


pro 


gly 


arg 


ser 


ile val 


ala 


ala 


ile 


363/121 
























GAC GAG 


TCG 


TCG 


TCA 


ACG 


ACC 


ACG 


ATC 












asp glu 


ser 


ser 


ser 


thr 


thr 


thr 


ile 













GCC CGT GGT TGC GGT 
ala arg gly cys gly 

TGC CAC TTG ATG TCG 
cys his leu met ser 

TCC TCA AAA CGT CGG 
ser ser lys arg arg 

ACG AAC TGA ATA AGT 
thr asn OPA ile ser 

CCG AGG CGA GGC TCA 
pro arg arg gly ser 

GCG GCG CAG TCG TCG 
ala ala gin ser ser 



SEQ ID N° 4C 
FEUILLE DE REMPOfflferff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



10/185 



partie de la sequence nucleotidique de seq4A 



^ l 31/11 

CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA TTT 
pro^arg ala thr ser arg his leu leu trp Pj^arg leu arg pro arg arg gly ser phe 

CGC AGC AAG CGG TCT CCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG GAC 
121/41* Ue 116 ala ala 9ln Ser ser as P 



GAG TCG TCG TCA ACG ACC ACG ATC 
glu ser ser ser thr thr thr ile 



SEQ ID N° 4A« 
FIGURE 4A» 



I' 1 31/11 

CGC GCG CGA CTT CCA GAC ATT TGT TGT GGT TTC GGT TGA GGC CGA GGC GAG GCT CAT TTC 
arg ala arg leu pro asp ile cys cys gly phe gly OPA gly arg gly glu ala his phe 
61/21 91/31 

GCA GCA AGC GGT CTC CGG GTC GCA GCA TCG TTG CGG CGA TCG CGG CGC AGT CGT CGG ACG 

121/41 3 ^ ar9 arg S8r arg arg thr 

AGT CGT CGT CAA CGA CCA CGA TC 
ser arg arg gin arg pro arg 



SEQ ID N° 4B 1 
FIGURE 4B' 



1/1 

GCC GCG CGC GAC 
ala ala arg asp 
61/21 

TCG CAG CAA GCG 
ser gin gin ala 
121/41 

CGA GTC GTC GTC 
arg val val val 



TTC CAG ACA TTT 
phe gin thr phe 

GTC TCC GGG TCG 
val ser gly ser 

AAC GAC CAC GAT 
asn asp his asp 



31/11 
GTT GTG GTT TCG 
val val val ser 

91/31 
CAG CAT CGT TGC 
gin his arg cys 

C 



GTT GAG GCC GAG 
val glu ala glu 

GGC GAT CGC GGC 
gly asp arg gly 



GCG AGG CTC ATT 
ala arg leu ile 

GCA GTC GTC GGA 
ala val val gly 



SEQ ID N° 4C 
FIGURE 4C» 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



11/185 

ORF d'apres par Cole et al. (Nature 393:537-544) et contenant la sequence Seq 



1/1 








tga ata 


agt ccg 


ccg 


cgc 


OPA ile 


ser pro 


pro 


arq 


61/21 








cga ggc 


tea ttt 


cgc 


aqc 


arg gly 


ser phe 


arg 


ser 


121/41 








cag teg 


teg gac 


gag 


teg 


gin ser 


ser asp 


glu 


ser 


181/61 








agg atg 


eta cgc 


aga 


cag 


arg met 


leu arg 


arg 


gin 


241/81 








gag ata 


age ggt 


ttc 


gec 


glu ile 


ser gly 


phe 


ala 


301/101 








tgg cga 


etc aga 


gac 


tag 


trp arg 


leu arg 


asp 


AMB 











31/11 








Qca 


act 


tec 


aga 


Cat tfcrr 


ttg 


tgg 


ttt 


ala 


thr 


ser 


ara 


his leu 


leu trp phe 










91/31 








aag 


egg 


tct 


ccg 


ggt cgc 


age 


ate gtt 


lys 


arg 


ser 


pro 


gly arg 


ser 


ile 


val 










151/51 








teg 


tea 


acg 


ace 


acg ate 


teg 


aac 


teg 


ser 


ser 


thr 


thr 


thr ile 


ser 


asn 


ser 










211/71 








cgc 


teg 


atg 


gtg 


gcg ccg 


ttg 


ttg 


tac 


arg 


ser 


met 


val 


ala pro 


leu 


leu 


tyr 










271/91 






ggg 


ttc 


ace 


gat 


ace acg 


ctt 


gat 


gca 


gly phe 


thr 


asp 


thr thr 


leu 


asp 


ala 



SEQ ID N° 4F 
FIGURE 4F 



sequence en amont de seq4A' et en fusion avec seq4A l 
1/1 31/11 

GCA ACC TAC CAG CAG AGC CAG GGG CTC ACA GGA CCT AAA GGA GTA GCG CCC ATG GCT 
ala thr tyr gin gin ser gin gly leu thr gly pro lys gly val ala pro met ala 

C 

SEQ ID N° 4J 
FIGURE 4 J 



seq4J' dans une autre phase de lecture 

1/1 31/11 

ACG CAA CCT ACC AGC AGA GCC AGG GGC TCA CAG GAC CTA AAG GAG TAG CGC CCA TGG CTG 

thr gin pro thr ser arg ala arg gly ser gin asp leu lys glu AMB arg pro trp leu 

61/21 

ATC 

ile 

SEQ ID N°4K 
FIGURE 4K 



seq 4JV dans la troisieme phase de lecture 
1/1 31/11 

CGC AAC CTA CCA GCA GAG CCA GGG GCT CAC AGG ACC TAA AGG AGT AGC GCC CAT GGC TGA 
arg asn leu pro ala glu pro gly ala his arg thr OCH arg ser ser ala his gly OPA 

TC 

SEQ ID N° 4L 



FEUILLE DE REMptifflfe#(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



12/185 



sequence Rv2050 


predite 


par 


Cole et 


al. 


(Nature 393 


:537- 




et 


1/1 


















31/11 




ATG GCT 


GAT 


CGT 


GTC 


CTG 


AGG 


GGC 


AGT 


CGC 


CTC GGA GCC 


GTG 


AGC 


TAT 


Met ala 


asD 


ara 


val 


leu 


arg 






arq 


leu alv ala 


val 


ser 


tyr 


61/21 


















91/31 






AAC CAC 


GAC 


CTG 


GCG 


CCG 


CGC 


CAG 


ATC 


GCG 


CGG tac car 


ACC 


GAC 


AAC 


asn his 


asD 


leu 


ala 


pro 


arg 




lie 


ala 


ara tvr a ret 


thr 


asp 


asn 


121/41 


















151/51 






GAA GTC 


CCG 


TTC 


GCC 


GAT 


GAC 


GCC 


GAG 


ATC 


CCC* fztzr arr 
^-^V* ouL. 


TGG 


TTG 


TGC 


glu val 


pro 


phe 


ala 


asp 


asp 


ala 


glu 


ile 


pro gly thr 


trp 


leu 


cys 


181/61 


















211/71 




GAA GGC 


ACC 


CTG 


ATC 


GAG 


GGC 


GAC 


CTG 


CCC 


GAG CCG AAG 


AAG GTT AAG 


glu gly 


thr 


leu 


ile 


glu 


gly 


asp 


leu 


pro 


glu pro lys 


lys 


val 


lys 


241/81 


















271/91 




CAC TGG 


GAC 


ATG 


CTG 


CTG 


GAG 


CGC 


CGT 


TCC 


ATC GAA GAA 


CTC 


GAA 


GAG 


his trp 


asp 


met 


leu 


leu 


glu 


arg 


arg 


ser 


ile glu glu 


leu 


glu 


glu 


301/101 


















331/111 




CGC CTC 


GAG 


CTC 


ATT 


CGG 


TCA 


CGT 


CGG 


CGC 


GGC TGA 








arg leu 


glu 


leu 


ile 


arg 


ser 


arg 


arg 


arg 


gly OPA 









SEQ ID N° 4M 
FIGURE 4M 



ORF d'apres 
1/1 


par 


Cole et 


al. 


(Nature 


393: 


;537-544) 
31/11 


et 


contenant la sequence Rv2050 


TAG TCC 


GCC 


CGG 


GTG 


TCC 


GAT 


CCC GGT 


ATC 


ATT GAT 


GGT 


CGC 


GCC 


GCG 


CGC 


GTC 


GCG 


TGC 


AMB ser 
61/21 


ala 


arg 


val 


ser 


asp 


pro gly 


ile 


ile asp 
91/31 


gly 


arg 


ala 


ala 


arg 


val 


ala 


cys 


CGG GAA 


CTA 


CGC 


AGA 


CGG 


CCG 


CAG CGT 


TTG 


CCA ACC 


GGA 


GCC 


AGT 


CGC 


CAG 


TAC 


GCA 


ACC 


arg glu 


leu 


arg 


arg 


arg 


pro 


gin arg 


leu 


pro thr 


gly 


ala 


ser 


arg 


gin 


tyr 


ala 


thr 


121/41 
















151/51 










TAC CAG 


CAG 


AGC 


CCA 


GGG 


CTC 


ACA GGA 


CCT 


AAA GGA 


GTA 


GCG 


CCC 


ATG 


GCT 


GAT 


CGT 


GTC 


tyr gin 


gin 


ser 


pro 


gly 


leu 


thr gly 


pro 


lys gly 


val 


ala 


pro 


met 


ala 


asp 


arg 


val 


181/61 
















211/71 










CTG AGG 


GGC 


AGT 


CGC 


CTC 


GGA 


GCC GTG 


AGC 


TAT GAG 


ACC 


GAC 


CGC 


AAC 


CAC 


GAC 


CTG 


GCG 


leu arg 


gly 


ser 


arg 


leu 


gly 


ala val 


ser 


tyr glu 


thr 


asp 


arg 


asn 


his 


asp 


leu 


ala 


241/81 
















271/91 














CCG CGC 


CAG 


ATC 


GCG 


CGG 


TAC 


CGC ACC 


GAC 


AAC GGC 


GAG 


GAG 


TTC 


GAA 


GTC 


CCG 


TTC 


GCC 


pro arg 


gin 


ile 


ala 


arg 


tyr 


arg thr 


asp 


asn gly 


glu 


glu 


phe 


glu 


val 


pro 


phe 


ala 


301/101 
















331/111 












GAT GAC 


GCC 


GAG 


ATC 


CCC 


GGC 


ACC TGG 


TTG 


TGC CGC 


AAC 


GGC 


ATG 


GAA 


GGC 


ACC 


CTG 


ATC 


asp asp 


ala 


glu 


ile 


pro 


gly 


thr trp 


leu 


cys arg 


asn 


gly 


met 


glu 


gly 


thr 


leu 


ile 


361/121 
















391/131 














GAG GGC 


GAC 


CTG 


CCC 


GAG 


CCG 


AAG AAG 


GTT 


AAG CCG 


CCC 


CGG 


ACG 


CAC 


TGG 


GAC 


ATG 


CTG 


glu gly 


asp 


leu 


pro 


glu 


pro 


lys lys 


val 


lys pro 


pro 


arg 


thr 


his 


trp 


asp 


met 


leu 


421/141 
















451/151 












CTG GAG 


CGC 


CGT 


TCC 


ATC 


GAA 


GAA CTC 


GAA 


GAG TTA 


CTT 


AAG 


GAG 


CGC 


CTC 


GAG 


CTC 


ATT 


leu glu 


arg 


arg 


ser 


ile 


glu 


glu leu 


glu 


glu leu 


leu 


lys 


glu 


arg 


leu 


glu 


leu 


ile 


481/161 




























CGG TCA 


CGT 


CGG 


CGC 


GGC 


TGA 
























arg ser 


arg 


arg 


arg 


gly 


OPA 

























SEQ ID N° 4N 
FEUILLE DE REMPI^E^f NJ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



13/185 



31/11 

GAT CGC GGT CAA CGA GGC CGA ATA CGG CGA GAT GTG GGC CCA AGA CGC CGC CGC GAT GTT 
asp arg gly gin arg gly arg ile arg arg asp val gly pro arg arg arg arg asp val 
61/21 91/31 

TGG CTA CGC CGC GGC GAC GGC GAC GGC GAC GGC GAC GTT GCT GCC GTT CGA GGA GGC GCC 
trp leu arg arg gly asp gly asp gly asp gly asp val ala ala val arg gly gly ala 
121/41 151/51 

GGA GAT GAC CAG CGC GGG TGG GCT CCT CGA GCA GGC CGC CGC GGT CGA GGA GGC CTC CGA 
gly asp asp gin arg gly trp ala pro arg ala gly arg arg gly arg gly gly leu arg 
181/61 211/71 

CAC CGC CGC GGC GAA CCA GTT GAT GAA CAA TGT GCC CCA GGC GCT GCA ACA GCT GGC CCA 
his arg arg gly glu pro val asp glu gin cys ala pro gly ala ala thr ala gly pro 
241/81 271/91 

GCC CAC GCA GGG CAC CAC GCC TTC TTC CAA GCT GGG TGG CCT GTG GAA GAC GGT CTC GCC 

301/101 ^ ^ 2113 9lU 917 

GCA TCG GTC GCC GAT C 
ala ser val ala asp 



SEQ ID N° 5A 
FIGURE 5A 



ATC GCG 


GTC 


AAC 


GAG GCC 


GAA 


ile ala 


val 


asn glu ala 


glu 


62/21 








GGC TAC 


GCC 


"GCG 


GCG ACG 


GCG 


gly tyr 


ala 


ala 


ala thr 


ala 


122/41 










GAG ATG 


ACC 


AGC 


GCG GGT 


GGG 


glu met 


thr 


ser 


ala gly 


gly 


182/61 






ACC GCC 


GCG 


GCG 


AAC CAG 


TTG 


thr ala 


ala 


ala 


asn gin 


leu 


242/81 








CCC ACG 


CAG 


GGC 


ACC ACG 


CCT 


pro thr 


gin 


gly thr thr 


pro 


302/101 










CAT CGG 


TCG 


CCG 


ATC 




his arg 


ser 


pro 


ile 











32/11 




TAC 


GGC 


GAG 


ATG TGG 


GCC 


tyr gly 


glu 


me t trp 


ala 








92/31 




ACG 


GCG 


ACG 


GCG ACG 


TTG 


thr 


ala 


thr 


ala thr 


leu 








152/51 




CTC 


CTC 


GAG 


CAG GCC 


GCC 


leu 


leu 


glu 


gin ala 


ala 








212/71 




ATG 


AAC 


AAT 


GTG CCC 


CAG 


met 


asn 


asn 


val pro 


gin 








272/91 




TCT 


TCC 


AAG 


CTG GGT 


GGC 


ser 


ser 


lys 


leu gly 


gly 



SEQ ID N° 5B 
FIGURE 5B 



CAA 


GAC GCC 


GCC 


GCG 


ATG 


TTT 


gin 


asp ala 


ala 


ala 


met 


phe 


CTG 


CCG TTC 


GAG 


GAG 


GCG 


CCG 


leu 


pro phe 


glu 


glu 


ala 


pro 


GCG 


GTC GAG 


GAG 


GCC 


TCC 


GAC 


ala 


val glu glu 


ala 


ser 


asp 


GCG 


CTG CAA 


CAG 


CTG 


GCC 


CAG 


ala 


leu gin gin 


leu 


ala 


gin 


CTG 


TGG AAG 


ACG 


GTC 


TCG 


CCG 


leu 


trp lys 


thr 


val 


ser 


pro 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



14/185 



33/11 

TCG CGG TCA ACG AGG CCG AAT ACG GCG AGA TGT GGG CCC AAG ACG CCG CCG CGA TGT TTG 
ser arg ser thr arg pro asn thr ala arg cys gly pro lys thr pro pro arg cys leu 
63/21 93/31 

GCT ACG CCG CGG CGA CGG CGA CGG CGA CGG CGA CGT TGC TGC CGT TCG AGG AGG CGC CGG 
ala thr pro arg arg arg arg arg arg arg arg arg cys cys arg ser arg arg arg arq 
123/41 153/51 

AGA TGA CCA GCG CGG GTG GGC TCC TCG AGC AGG CCG CCG CGG TCG AGG AGG CCT CCG ACA 
arg OPA pro ala arg val gly ser ser ser arg pro pro arg ser arg arg pro pro thr 
183/61 213/71 

CCG CCG CGG CGA ACC AGT TGA TGA ACA ATG TGC CCC AGG CGC TGC AAC AGC TGG CCC AGC 
pro pro arg arg thr ser OPA OPA thr met cys pro arg arg cys asn ser trp pro ser 
243/81 273/91 

CCA CGC AGG GCA CCA CGC CTT CTT CCA AGC TGG GTG GCC TGT GGA AGA CGG TCT CGC CGC 
pro arg arg ala pro arg leu leu pro ser trp val ala cys gly arg arg ser arq ara 
303/101 " * y 

ATC GGT CGC CGA TC 
ile gly arg arg 



SEQ ID N° 5C 
FIGURE 5C 



partie de la sequence nucleotidique Seq 5A 
1/1 



61/21 
GAC CAG 
asp glr 
121/41 
CGC GGC 
arg gl* 
181/61 



241/81 
GTC GCC GAT C 
val ala asp 



















31/11 










GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GTT GCT GCC 


GTT CGA GGA GGC 


GCC 


GGA 


GAT 


gly 


asp 


gly 


asp 


gly 


asp 


gly 


asp 


val ala ala 


val arg gly gly 


ala 


gly 


asp 


















91/31 






CGC 


GGG 


TGG 


GCT 


CCT 


CGA 


GCA 


GGC 


CGC CGC GGT 


CGA GGA GGC CTC 


CGA 


CAC 


CGC 


arg 


gly 


trp 


ala 


pro 


arg 


ala 


gly 


arg arg gly 


arg gly gly leu 


arg 


his 


arg 


















151/51 






GAA 


CCA 


GTT 


GAT 


GAA 


CAA 


TGT 


GCC 


CCA GGC GCT 


GCA ACA GCT GGC 


CCA 


GCC 


CAC 


glu 


pro 


val 


asp 


glu 


gin 


cys 


ala 


pro gly ala 


ala thr ala gly 


pro 


ala 


his 


















271/71 






CAC 


CAC 


GCC 


TTC 


TTC 


CAA 


GCT 


GGG 


TGG CCT GTG 


GAA GAC GGT CTC 


GCC 


GCA 


TCG 


his 


his 


ala 


phe 


phe 


gin 


ala 


gly 


trp pro val 


glu asp gly leu 


ala 


ala 


ser 



SEQ ID N° 5A« 
FIGURE 5A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



15/185 



1/1 31/11 

TAG GCC GCG GCG ACG GCG ACG GCG ACG GCG ACG TTG CTG CCG TTC GAG GAG GCG CCG GAG 
tyr ala ala ala thr ala thr ala thr ala thr leu leu pro phe glu glu ala Dro alu 
61/21 91/31 

ATG ACC AGC GCG GGT GGG CTC CTC GAG CAG GCC GCC GCG GTC GAG GAG GCC TCC GAC ACC 
met thr ser ala gly gly leu leu glu gin ala ala ala val glu glu ala ser asp thr 
121/41 151/51 

GCC GCG GCG AAC CAG TTG ATG AAC AAT GTG CCC CAG GCG CTG CAA CAG CTG GCC CAG CCC 
ala ala ala asn gin leu met asn asn val pro gin ala leu gin gin leu ala gin oro 
181/61 211/71 

ACG CAG GGC ACC ACG CCT TCT TCC AAG CTG GGT GGC CTG TGG AAG ACG GTC TCG CCG CAT 
thr gin gly thr thr pro ser ser lys leu gly gly leu trp lys thr val ser pro his 
241/81 

CGG TCG CCG ATC 
arg ser pro ile 



SEQ ID N° 5B» 
FIGURE SB 1 



1/1 • 31/11 

ACG CCG ( 
thr pro i 
61/21 
TGA CCA i 
OPA pro i 
121/41 
CCG CGG ( 
pro arg < 
181/61 



241/81 
GGT CGC CGA TC 
gly arg arg 



CGA 


CGG 


CGA CGG 


CGA 


CGG 


CGA 


CGT TGC 


TGC 


CGT TCG 


AGG 


AGG 


CGC 


CGG 


AGA 


arg 


arg 


arg arg 


arg 


arg 


arg 


arg cys 


cys 


arg ser 


arg 


arg 


arg 


arg 


arg 














91/31 










CGG 


GTG 


GGC TCC 


TCG 


AGC 


AGG 


CCG CCG 


CGG 


TCG AGG 


AGG 


CCT 


CCG 


ACA 


CCG 


arg 


val 


gly ser 


ser 


ser 


arg 


pro pro 


arg 


ser arg 


arg 


pro 


pro 


thr 


pro 














151/51 










ACC AGT 


TGA TGA ACA ATG 


TGC 


CCC AGG 


CGC 


TGC AAC 


AGC 


TGG 


CCC 


AGC 


CCA 


thr 


ser 


OPA OPA thr 


met 


cys 


pro arg 


arg 


cys asn 


ser 


trp 


pro 


ser 


pro 














211/71 










CCA 


CGC 


CTT CTT 


CCA 


AGC 


TGG 


GTG GCC 


TGT 


GGA AGA 


CGG 


TCT 


CGC 


CGC 


ATC 


pro 


arg 


leu leu 


pro 


ser 


trp 


val ala 


cys 


gly arg 


arg 


ser 


arg 


arg 


ile 



SEQ ID N° 5C 
FIGURE 5C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



ORF predite 


par 


Cole et 


al. 


1/1 












tga act 


gat 


gat 


tct 


gat 


age 


OPA thr 


asp 


asp 


ser 


asp 


ser 


61/21 












caa cga 


ggc 


cga 


ata 


egg 


cga 


gin arg 


gly 


arg 


ile 


arg 


arg 


121/41 












cgc ggc 


gac 


ggc 


gac 


ggc 


gac 


arg gly 


asp 


gly 


asp 


gly 


asp 


181/61 












cag cgc 


ggg 


tgg 


get 


cct 


cga 


gin arg 


gly 


trp 


ala 


pro 


arg 


241/81 










ggc gaa 


cca 


gtt 


gat 


gaa 


caa 


gly glu 


pro 


val 


asp 


glu 


gin 


301/101 












ggg cac 


cac 


gcc 


ttc 


ttc 


caa 


gly his 


his 


ala 


phe 


phe 


gin 


361/121 










gcc gat 


cag 


caa 


cat 


ggt 


gtc 


ala asp 


gin 


gin 


his 


gly 


val 


421/141 










gtc gat 


gac 


caa 


cac 


ctt 


gag 


val asp 


asp 


gin 


his 


leu 


glu 


481/161 










ggc cgt 


gca 


aac 


cgc 


ggc 


gca 


gly arg 


ala 


asn 


arg 


gly 


ala 


541/181 












ggg ttc 


ttc 


ggg 


tct 


ggg 


egg 


gly phe 


phe 


gly 


ser 


gly 


arg 


601/201 










ttc gtt 


gtc 


ggt 


gcc 


gca 


ggc 


phe val 


val 


gly 


ala 


ala 


gly 


661/221 










ggc get 


gcc 


get 


gac 


cag 


cct 


gly ala 


ala 


ala 


asp 


gin 


pro 


721/241 












egg get 


gcc 


ggt 


ggg 


gca 


gat 


arg ala 


ala 


gly 


gly 


ala 


asp 


781/261 










tgt tec 


gcc 


gcg 


ace 


eta 


tgt 


cys ser 


ala 


ala 


thr 


leu 


cys 


841/281 










cag act 


gtc 


gtt 


att 


tga 




gin thr 


val 


val 


ile 


OPA 





16/185 



(Nature 


393:537-544) 


et 








31/11 




gac 


caa 


cct 


ctt ggg 


gca 


asp 


gin 


pro 


leu gly ala 








91/31 




gat 


gtg 


ggc 


cca aga 


cgc 


asp 


val 


gly 


pro arg 


ara 








151/51 




ggc 


gac 


gtt 


get gcc 


gtt 


gly 


asp 


val 


ala ala 


val 








211/71 




gca 


ggc 


cgc 


cgc ggt 


cga 


ala 


gly 


arg 


arg gly 


arg 








271/91 




tgt 


gcc 


cca 


ggc get 


gca 


cys 


ala 


pro 


gly ala 


ala 








331/111 




get 


ggg 


tgg 


cct gtg 


gaa 


ala 


gly 


trp 


pro val 


glu 








391/131 




gat 


ggc 


caa 


caa cca 


cat 


asp 


gly 


gin 


gin pro 


his 








451/151 




etc 


gat 


gtt 


gaa ggg 


ctt 


leu 


asp 


val 


glu gly leu 








511/171 




aaa 


egg 


ggt 


ccg ggc 


gat 


lys 


arg 


gly 


pro gly 


asp 








571/191 




tgg 


ggt 


ggc 


cgc caa 


ctt 


trp 


gly 


gly 


arg gin 


leu 








631/211 




ctg 


ggc 


cgc 


ggc caa 


cca 


leu 


gly 


arg 


gly gin 


pro 








691/231 




gac 


cag 


cgc 


cgc gga 


aag 


asp 


gin 


arg 


arg gly lys 








751/251 




ggg 


cgc 


cag 


ggc egg 


tgg 


gly 


arg 


gin 


gly arg trp 








811/271 




gat 


gcc 


gca 


ttc tec 


ggc 


asp 


ala 


ala 


phe ser 


gly 



SEQ ID N° 5F. 
FIGURE 5F 



contenant seqSA' 



aaa 
lys 


cac 
his 


ccc 
pro 


ggc gat 
gly asp 


cgc ggt 
arg gly 


cgc 
arg 


cgc 
arg 


gat 
asp 


gtt. 
val 


tgg 
trp 


eta cgc 
leu arg 


cga 
arg 


gga 
gly 


ggc 
gly 


gcc 
ala 


gga 
gly 


gat gac 
asp asp 


gga 
gly 


ggc 
gly 


etc 
leu 


cga 
arg 


cac 
his 


cgc cgc 
arg arg 


aca 
thr 


get 
ala 


ggc 
gly 


cca 
pro 


gcc 
ala 


cac gca 
his ala 


gac 
asp 


ggt 
gly 


etc 
leu 


gcc 
ala 


gca 
ala 


teg gtc 
ser val 


gtc 
val 


gat 
asp 


gac 
asp 


caa 
gin 


etc 
leu 


ggg tgt 
gly cys 


tgc 
cys 


tec 
ser 


ggc 

giy 


ggc 
gly 


ggc 

gly 


cgc cca 
arg pro 


gag 
glu 


etc 
leu 


get 
ala 


ggg 

gly 


cag 
gin 


etc get 
leu ala 


ggg 

gly 


teg 
ser 


ggc 
gly 


ggc 
gly 


etc 
leu 


ggt egg 


ggc 
gly 


agt 
ser 


cac 
his 


ccc 
pro 


ggc 
gly 


ggc gcg 
gly ala 


agg 
arg 


gcc 
ala 


egg 
arg 


gca 
ala 


gat 
asp 


get ggg 
ala gly 


tgg 
trp 


get 
ala 


cag 
gin 


tgg 
trp 


tgt 
cys 


get gcg 
ala ala 


ggc 
gly 


egg 
arg 


eta 
leu 


gga 
gly 


gag 
glu 


ggg gcg 

gly ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



17/185 



sequence Rvll96 predite par 
ORF en fusion avec Seq5A' 
1/1 



atg gtg 


gat 


ttc 


999 


gcg 


tta 


Met val 


asp 


phe 


alv 


ala 


leu 


61/21 












ggt teg 


gcc 


teg 


ctg 


gtg 


gcc 


gly ser 


ala 


ser 


leu 


val 


ala 


121/41 












teg gcc 


gcg 


teg 


gcg 


ttt 


cag 


ser ala 


ala 


ser 


ala 


Dhe 


aln 


181/61 










teg teg 


gcg 


ggt 


ctg 


atg 


gtg 


ser ser 


ala 


gly 


leu 


met 


val 


ala ala 


ser 


pro 


tyr 


val 


ala 


241/81 












aco aaa 


caa 

v. ay 


ace 


aaa 


ctg 


acc 


ala gly 


gin 


ala 


glu 


leu 


thr 


301/101 












gcg tat 


ggg 


eta 


aca 


ata 


ccc 


ala tyr 


gly 


leu 


thr 


val 


pro 


361/121 












ctg ata 


acq 


acc 


aac 


etc 


ttg 


leu ile 


ala 


thr 


asn 


leu 


leu 


421/141 












tac age 

33 


aaa 


ata 


taa 


gcc 


caa 


tyr gly 


glu 


met 


trp 


ala 


aln 

3 XU 


481/161 










aca aca 


aca 


aca 


acg 


tta 


ctg 


thr ala 


thr 


ala 


thr 


leu 


leu 


541/181 












etc etc 


aaa 


caa 

w **3 


acc 


gcc 


gcg 


leu leu 


glu 


gin 


ala 


ala 


ala 


601/201 












atg aac 


aat 


gtg 


ccc 


caa 


aca 

3 W 3 


met asn 


asn 


val 


pro 


gin 


ala 


661/221 










tct tec 


aag 


ctg 


aat 


aac 

33 w 


eta 


ser ser 


lys 


leu 


gly 


gly 


leu 


721/241 










atg gtg 


teg 


atg 


gcc 


aac 


aac 


met val 


ser 


met 


ala 


asn 


asn 


781/261 












ace ttg 


age 


teg 


atg 


ttg 


aag 


thr leu 


ser 


ser 


met 


leu 


lys 


841/281 










gcg gcg 


caa 


aac 


ggg 


gtc 


egg 


ala ala 


gin 


asn 


gly 


val 


arg 


901/301 












ctg ggc 


ggt 


ggg 


gtg 


gcc 


gcc 


leu gly 


gly 


gly 


val 


ala 


ala 


961/321 












ccg cag 


gcc 


tgg 


gcc 


gcg 


gcc 


pro gin 


ala 


trp 


ala 


ala 


ala 


1021/341 










acc age 


ctg 


acc 


age 


gcc 


gcg 


thr ser 


leu 


thr 


ser 


ala 


ala 


1081/361 










ggg cag atg 


ggc 


gcc 


agg 


gcc 


gly gin met 


gly 


ala 


arg 


ala 


1141/381 








ccc tat gtg 


atg 


ccg 


cat 


tct 


pro tyr val 


met 


pro 


his 


ser 



Cole et al. (Nature 393:537- 









31/11 








cca 


ccg 


gag 


ate aac 


tec 


gcg 


agg 


pro 


pro 


glu 


ile asn 


ser 


ala 


arg 








91/31 






gcg 


get 


cag 


atg tgg 


gac 


age 


gtg 


ala 


ala 


gin 


met trp 


asp 


ser 


val 








151/51 








teg 


gtg 


gtc 


tgg ggt 


ctg 


acg 


gtg 


ser 


val 


val 


trp gly 


leu 


thr 


val 








211/71 








gcg 


gcg 


gcc 


teg ccg 


tat 


gtg 


aca 


ala 












trp 


met 


ser 


val thr 














271/91 








gcc 


gcc 


cag 


gtc egg 


gtt 


get 


gcg 


ala 


ala 


gin 


val arg 


val 


ala 


ala 








331/111 








ccg 


ccg 


gtg 


ate gcc 


gag 


aac 


cgt 


pro 


pro 


val 


ile ala 


glu 


asn 


ara 








391/131 








ggg 


caa 


aac 


acc ccg 


gcg 


ate 


gcg 


gly 


gin 


asn 


thr pro 


ala 


ile 


ala 








451/151 








gac 


gcc 


gcc 


gcg atg 


ttt 


ggc 


tac 


asp 


ala 


ala 


ala met 


phe 


alv 

3 JT 


tvr 








511/171 








ccg 


ttc 


gag 


gag gcg 


ccg 


gag 


atg 


pro 


phe 


glu 


glu ala 


Dro 


alu 


met 








571/191 








gtc 


gag 


gag 


gcc tec 


gac 


acc 


gcc 


val 


glu 


glu 


ala ser 


asp 

** 


thr 


ala 








631/211 








ctg 


caa 


cag 


ctg gcc 


cag 


ccc 


acg 


leu 


gin 


gin 


leu ala 


gin 


pro 


thr 








691/231 








tgg 


aag 


acg 


gtc teg 


ccg 


cat 


egg 


trp 


lys 


thr 


val ser 


pro 


his 


arg 








751/251 








cac 


atg 


teg 


atg acc 


aac 


teg 


ggt 


his 


met 


ser 


met thr 


asn 


ser 


gly 








811/271 






ggc 


ttt 


get 


ccg gcg 


gcg 


gcc 


gcc 


gly 


phe 


ala 


pro ala 


ala 


ala 


ala 








871/291 








gcg 


atg 


age 


teg ctg 


ggc 


age 


teg 


ala 


met 


ser 


ser leu 


gly 


ser 


ser 








931/311 








aac 


ttg 


ggt 


egg gcg 


gcc 


teg 


gtc 


asn 


leu 


gly 


arg ala 


ala 


ser 


val 








991/331 








aac 


cag 


gca 


gtc acc 


ccg 


gcg 


gcg 


asn 


gin 


ala 


val thr 


pro 


ala 


ala 








1051/351 






gaa 


aga 


ggg 


ccc ggg 


cag 


atg 


ctg 


glu 


arg 


gly 


pro gly gin 


met 


leu 








1111/371 






ggt 


ggt 


ggg 


etc agt 


ggt 


gtg 


ctg 


gly 


gly 


gly 


leu ser gly 


val 


leu 








1171/391 






ccg 


gcg 


gcc 


ggc tag 








pro 


ala 


ala 


gly AMB 









SEQ ID N° 5R 



) et pouvant coder pour une 



atg 
met 


tac 
tyr 


gcc 
ala 


ggc 
gly 


ccg 
pro 


gcg 
ala 


agt 
ser 


gac 
asp 


ctg 
leu 


ttt 
phe 


ggg 

gly 


teg 
ser 


tgg 
trp 


ata 
ile 


ggt 
gly 


tgg 


atg 


age 


gtc 


acc 


gcg 
ala 


gcc 
ala 


tac 
tyr 


gag 
glu 


acg 
thr 


get 
ala 


gaa 
glu 


ctg 
leu 


atg 
met 


att 
ile 


gtc 
val 


aac 
asn 


gag 
glu 


gcc 
ala 


gaa 
glu 


gcc 
ala 


gcg 
ala 


gcg 
ala 


acg 
thr 


gcg 

ala 


acc 
thr 


age 
ser 


gcg 
ala 


ggt 

gly 


ggg 

gly 


gcg 

ala 


gcg 
ala 


aac 
asn 


cag 
gin 


ttg 
leu 


cag 
gin 


ggc 
gly 


acc 
thr 


acg 
thr 


cct 
pro 


teg 
ser 


ccg 
pro 


ate 
ile 


age 
ser 


aac 
asn 


gtg 
val 


teg 
ser 


atg 
met 


acc 
thr 


aac 
asn 


cag 
gin 


gcc 
ala 


gtg 

val 


caa 
gin 


acc 
thr 


ctg 
leu 


ggt 
gly 


tct 
ser 


teg 
ser 


ggt 

gly 


ggt 

gly 


teg 
ser 


ttg 
leu 


teg 
ser 


gtg 
val 


egg 
arg 


gcg 
ala 


ctg 
leu 


ccg 
pro 


ctg 
leu 


ggc 
gly 


ggg 

gly 


ctg 
leu 


ccg 
pro 


gtg 
val 


cgt 
arg 


gtt 
val 


ccg 
pro 


ccg 
pro 


cga 
arg 



FIGURE 5R 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



18/185 



Seq 5P: ORF d'apres Cole et al. (Nature 
1/1 



tag gga 


cac 


gta 


atg gtg 


gat ttc 


ggg 


oca 


AMB gly 


his 


val 


met val 


asp phe 


gly 


ala 


61/21 












tac gcc 


ggc 


ccg 


ggt teg 


gcc teg 


eta 


ata 


tyr ala 


gly 


pro 


gly ser 


ala ser 


leu 


val 


121/41 
















agt gac 


ctg 


ttt 


teg gcc 


aca tea 


aca 


ttt 


ser asp 


leu 


phe 


ser 


ala 


ala ser 


ala 


Dhe 


181/61 














teg tgg 


ata 


ggt 


teg teg 


aca aat 


ctg 


atg 


ser trp 


ile 


gly 


ser 


ser 


ala gly 


leu 


met 


241/81 














atg age 


ate 


acc 


gcg 


ggg 


caa acc 


aaa 
y a y 




met ser 


val 


thr 


ala gly 


gin ala 


glu 


leu 


301/101 














gcc tac 


gag 


acg 


gcg 


tat 


ggg ctg 


acg 


ata 
y u y 


ala tyr 


glu 


thr 


ala 


tyr 


gly leu 


thr 


val 


361/121 












gaa ctg 


atg 


att 


ctg 


ata 


gcg acc 


aac 


etc 


glu leu 


met 


ile 


leu 


ile 


ala thr 


asn 


leu 


421/141 
















aac gag 


gcc 


gaa 


tac 


ggc 


gag atg 


tgg 


gcc 


asn glu 


ala 


glu 


tyr gly 


glu met 


trD 


ala 


481/161 














gcg gcg 


acg 


gcg 


acg 


gcg 


aca aca 


acg 


tta 


ala ala 


thr 


ala 


thr 


ala 


thr ala 


thr 


leu 


541/181 
















age gcg 


ggt 


ggg 


etc 


etc 


aaa caa 


acc 


gcc 


ser ala 


gly 


gly 


leu 


leu 


glu gin 


ala 


ala 


601/201 














gcg aac 


cag 


ttg 


atg 


aac 


aat gtg 


ccc 


caa 


ala asn 


gin 


leu 


met 


asn 


asn val 


pro 


gin 


661/221 












ggc acc 


acg 


cct 


tct 


tec 


aag ctg 


ggt 


ggc 


gly thr 


thr 


pro 


ser 


ser 


lys leu 


gly 


gly 


721/241 










ccg ate 


age 


aac 


atg 


gtg 


teg atg 


gcc 


aac 


pro ile 


ser 


asn 


met 


val 


ser met 


ala 


asn 


781/261 
















teg atg 


acc 


aac 


acc 


ttg 


age teg 


atg 


ttg 


ser met 


thr 


asn 


thr 


leu 


ser ser 


met 


leu 


841/281 
















gcc gtg 


caa 


acc 


gcg 


gcg 


caa aac 


ggg 


gtc 


ala val 


gin 


thr 


ala 


ala 


gin asn 


gly 


val 


901/301 












ggt tct 


teg 


ggt 


ctg ggc 


ggt ggg 


gtg 


gcc 


gly ser 


ser 


gly 


leu gly 


gly gly 


val 


ala 


961/321 














teg ttg 


teg 


gtg 


ccg 


cag 


gcc tgg 


gcc 


gcg 


ser leu 


ser 


val 


pro gin 


ala trp 


ala 


ala 


1021/341 












gcg ctg 


ccg 


ctg 


acc 


age 


ctg acc 


age 


gcc 


ala leu 


pro 


leu 


thr 


ser 


leu thr 


ser 


ala 



1081/361 1111/371 
ggg ctg ccg gtg ggg cag atg ggc gcc agg 
gly leu pro val gly gin met gly ala arg 
1141/381 

gtt ccg ccg cga ccc tat gtg atg ccg cat 
val pro pro arg pro tyr val met pro his 



393:537-544] 


i et 


contenant la sequence K< 


31/11 


















tta cca 
leu pro 
91/31 


ccg 
pro 


gag 
glu 


ate 
ile 


aac 
asn 


tec 
ser 


gcg 

ala 


agg 
arg 


atg 
met 


gcc gcg 
ala ala 
151/51 


get 
ala 


cag 
gin 


atg 

met 


tgg 
trp 


gac 
asp 


age 
ser 


gtg 

val 


gcg 
ala 


cag teg 
gin ser 
211/71 


gtg 
val 


gtc 
val 


tgg 
trp 


ggt 
gly 


ctg 
leu 


acg 
thr 


gtg 
val 


ggg 

gly 


gtg gcg 
val ala 
271/91 


gcg 
ala 


gcc 
ala 


teg 
ser 


ccg 
pro 


tat 
tyr 


gtg 
val 


gcg 
ala 


tgg 
trp 


acc gcc 
thr ala 
331/111 


gcc 
ala 


cag 

aln 
y 1 " 


gtc 
val 


egg 
arg 


gtt 

val 


get 
ala 


gcg 
ala 


gcg 
ala 


ccc ccg 
pro pro 
391/131 


ccg 
pro 


gtg 
val 


ate 
ile 


gcc 
ala 


gag 
glu 


aac 
asn 


cgt 
arg 


get 
ala 


ttg ggg 
leu gly 
451/151 


caa 
gin 


aac 
asn 


acc 
thr 


ccg 
pro 


gcg 
ala 


ate 
ile 


gcg 
ala 


gtc 
val 


caa gac 
gin asp 
511/171 


gcc 
ala 


gcc 
ala 


gcg 
ala 


atg 
met 


ttt 
phe 


ggc 

gly 


tac 
tyr 


gcc 
ala 


ctg ccg 
leu pro 
571/191 


ttc 
phe 


gag 
alu 


gag 
glu 


gcg 
ala 


ccg 
pro 


gag 
glu 


atg 
met 


acc 
thr 


gcg gtc 
ala val 
631/211 


gag 
glu 


gag 
glu 


gcc 
ala 


tec 
ser 


gac 
asp 


acc 
thr 


gcc 
ala 


gcg 

ala 


gcg ctg 
ala leu 
691/231 


caa 
gin 


cag 
gin 


ctg 
leu 


gcc 
ala 


cag 
gin 


ccc 
pro 


acg 
thr 


cag 
gin 


ctg tgg 
leu trp 
751/251 


aag 
lys 


acg 
thr 


gtc 
val 


teg 
ser 


ccg 
pro 


cat 
his 


egg 
arg 


teg 
ser 


aac cac 
asn his 
811/271 


atg 
met 


teg 
ser 


atg 
met 


acc 
thr 


aac 
asn 


teg 
ser 


ggt 
gly 


gtg 
val 


aag ggc 
lys gly 
871/291 


ttt 
phe 


get 
ala 


ccg 
pro 


gcg 
ala 


gcg 
ala 


gcc 
ala 


gcc 
ala 


cag 
gin 


egg gcg 
arg ala 
931/311 


atg 
met 


age 
ser 


teg 
ser 


ctg 
leu 


ggc 

gly 


age 
ser 


teg 
ser 


ctg 
leu 


gcc aac 
ala asn 
991/331 


ttg 
leu 


ggt 
gly 


egg 
arg 


gcg 
ala 


gcc 
ala 


teg 
ser 


gtc 
val 


ggt 
gly 


gcc aac cag 
ala asn gin 
1051/351 


gca 
ala 


gtc 
val 


acc 
thr 


ccg 
pro 


gcg 

ala 


gcg 
ala 


egg 
arg 


gcg gaa 
ala glu 


aga 
arg 


ggg 

gly 


ccc 
pro 


ggg 

gly 


cag 
gin 


atg 
met 


ctg 
leu 


ggc 
gly 


gcc ggt ggt 
ala gly gly 
1171/391 


ggg 

gly 


etc 
leu 


agt 
ser 


ggt 
gly 


gtg 

val 


ctg 
leu 


cgt 
arg 


tct ccg 
ser pro 


gcg 
ala 


gcc 
ala 


ggc 
gly 


tag 
AMB 











SEQ ID N° 5P 



FEUILLE DE REMfiil&ffiiE&¥ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



GGA TCC 


TGA 


TGC AAG 


TGG 


TCC 


alv ser 


OPA 


cys lys 


trp 


ser 


61/21 










TTG GTG 


CAT 


CCG GGC 


TGC 


GAG 


leu val 


his 


oro olv 


cys glu 


121/41 










CTT GCC 


CAC 


TGT TCC 


TCC 


CTG 


leU cllcl 


his 


cys ser 


ser 


leu 


181/61 










GCG GTG 


CCT 


GGG CAT 


CCA 


GCA 


ala val 


oro 


gly his 


pro 


ala 


241/81 








TCA CCA 


ACG 


TCG AAA 


CCG ACG 


ser pro 


thr 


ser lys 


pro 


thr 


301/101 






GCT GTA 


CCC 


TCA CCG 


AAC 


GTG 


ala val 


pro 


ser pro 


asn 


val 


361/121 










GCA GCC 


GAG 


CTC AAG 


GTG 


TCC 


ala ala 


glu 


leu lys 


val 


ser 


421/141 








GAA GGA 


GAA 


GAT C 






glu gly 


glu 


asp 






GAT CCT 


GAT 


GCA AGT 


GGT 


CCG 


asp pro 


asp 


ala ser 


gly pro 


62/21 










TGG TGC 


ATC 


CGG GCT 


GCG AGC 


trp cvs 


ile 


arg ala 


ala 


ser 


122/41 










TTG CCC 


ACT 


GTT CCT 


CCC 


TGC 


leu pro 


thr 


val pro 


pro 


cys 


182/61 








CGG TGC 


CTG 


GGC ATC 


CAG 


CAA 


arq cvs 


leu 


Cilv ile 

y-i-y lie 


gin gin 


242/81 










CAC CAA 


CGT 


CGA AAC 


CGA 


CGG 


his gin 


arg 


arg asn 


arg 


arg 


302/101 










CTG TAC 


CCT 


CAC CGA 


ACG 


TGA 


leu tyr 


pro 


his arg 


thr 


OPA 


362/121 








CAG CCG 


AGC 


TCA AGG 


TGT 


CCC 


gin pro 


ser 


ser arg 


cys 


pro 


422/141 










AAG GAG 


AAG 


ATC 






lys glu 


lys 


ile 







19/185 



31/11 

GGG ATT TGT CGG CAG CCA 
gly ile cys arg gin pro 
91/31 

CAT GCA CGC ACC GAC CAG 
his ala arg thr asp gin 
151/51 

CCG GCA CCA TGT GCG ACA 
pro ala pro cys ala thr 

211/71 
AAA CGG GGA GCT CAA GAA 
lys arg gly ala gin glu 

271/91 
GTT GCC AGC CGG CCC ACG 
val ala ser arg pro thr 

331/111 
AGT CCC ACA CCG CGG AGG 
ser pro thr pro arg arg 

391/131 
CGC ACC ACT GTC TCG AAT 
arg thr thr val ser asn 



SEQ ID N° 6A 
FIGURE 6A 









32/11 


GGA 


TTT 


GTC 


GGC AGC CAC 


gly phe 


val 


gly ser his 








92/31 


ATG 


CAC 


GCA 


CCG ACC AGC 


met 


his 


ala 


pro thr ser 








152/51 


CGG 


CAC 


CAT 


GTG CGA CAA 


arg 


his 


his 


val arg gin 








212/71 


AAC 


GGG 


GAG 


CTC AAG AAC 


asn 


gly 


glu 


leu lys asn 








272/91 


TTG 


CCA 


GCC 


GGC CCA CGA 


leu 


pro 


ala 


gly pro arg 








332/111 


GTC 


CCA 


CAC 


CGC GGA GGC 


val 


pro 


his 


arg gly gly 








392/131 


GCA 


CCA 


CTG 


TCT CGA ATG 


ala 


pro 


leu 


ser arg met 



SEQ ID N° 6B 



CCG 
arg 


CGG 
arg 


TCC 
ser 


CGT 
arg 


CGA 
arg 


CCA 
pro 


ACG 
thr 


CGC GGC GAG 
arg gly glu 


CGC 
arg 


GGC 
gly 


TAG 
AMB 


CTG 
leu 


AGC 
ser 


TTA AGC 
leu ser 


GCA 
ala 


GCA 
ala 


GTA 
val 


CCG 
pro 


CGA TTC ATG 
arg phe met 


AAC 
asn 


GAG 
glu 


GGG 
gly 


TCG 
sec 


ATA 
ile 


TTG 
leu 


CGT 
arg 


GCT 
ala 


CGA 
arg 


GGG 
gly 


TCC 
ser 


CGG 
arg 


GCG 
ala 


ACT 
thr 


CTG 
leu 


GCG 
ala 


TCG 
ser 


TTA 
leu 


GCT TTT 
ala phe 


AAC 
asn 


CGA 
arg 


CCG 
pro 


GAT 
asp 


CCA 
pro 


GGC GGT CCC 
gly gly pro 


GTC 
val 


GAC 
asp 


CAA 
gin 


CGT 
arg 


GCG 
ala 


GCG 
ala 


AGC 
ser 


GCG 
ala 


GCT 
ala 


AGC 
ser 


TGC 
cys 


GCT 
ala 


TAA 
OCH 


GCG 
ala 


CAG 
gin 


CAG 
gin 


TAC 
tyr 


CGG 
arg 


GAT 
asp 


TCA 
ser 


TGA 
OPA 


ACG 
thr 


AGG 

arg 


V7V7 1 

gly 


arg 


TAT 
tyr 


TGC 
cys 


GTG 
val 


CTC 
leu 


GAG 
glu 


GGT 
gly 


CCG 
pro 


GGG 
gly 


CGA 
arg 


CTC 
leu 


TGG 
trp 


CGT 
arg 


CGT 
arg 


TAG 
AMB 


CTT 
leu 


TTA 
leu 


ACC 
thr 


GAC 
asp 


CGG 
arg 


ATC 
iie 


CAG 
gin 



FEUILLE DE REMpl3®E^fefff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



20/185 



ATC CTG 


ATG 


CAA GTG 


GTC 


CGG 


GAT 


ile leu 


met 


gin val 


val 


arg 


asp 


63/21 








GGT GCA 


TCC 


GGG CTG 


CGA 


GCA 


TGC 


alv ala 

3 J ***** 


ser 


crlv leu 


arg 


ala 


cys 


123/41 










TGC CCA 


CTG 


TTC CTC 


CCT 


GCC 


GGC 


cvs pro 


leu 


phe leu 


pro ala gly 


183/61 












GGT GCC 


TGG 


GCA TCC 


AGC 


AAA 


ACG 


gly ala 


trp 


ala ser 


ser 


lys 


thr 


243/81 










ACC AAC 


GTC 


GAA ACC 


GAC 


GGT 


TGC 


thr asn 


val 


glu thr 


asp 


gly 


cys 


303/101 










TGT ACC 


CTC 


ACC GAA 


CGT 


GAG 


TCC 


cys thr 


leu 


thr glu 


arg 


glu 


ser 


363/121 








AGC CGA 


GCT 


CAA GGT 


GTC 


CCG 


CAC 


ser arg 


ala 


gin gly 


val 


pro 


his 


423/141 










AGG AGA 


AGA 


TC 








arg arg 


arg 











33/11 
GCA GCC 
ala ala 
93/31 
CGA CCA 
arg pro 
153/51 
TGC GAC 
cys asp 
213/71 
TCA AGA 
ser arg 
273/91 
GCC CAC 
> ala his 
333/111 
GCG GAG 
ala glu 
393/131 



ACG 


GCG 


GTC 


CCG 


TCG 


ACC 


AAC 


GTT 


thr 


ala 


val 


pro 


ser 


thr 


asn 


val 


GCG 


CGG 


CGA 


GCG 


CGG 


CTA 


GCT 


GCT 


ala 


arg 


arg 


ala 


arg 


leu 


ala 


ala 


AAG 


CTT 


AAG 


CGC 


AGC 


AGT 


ACC 


GGC 


lys leu lys 


arg 


scr 


ser 


thr 


gly 


ACG 


ATT 


CAT 


GAA 


CGA 


GGG 


GTC 


GTC 


thr 


ile 


his 


glu arg 


gly 


val 


val 


GAT 


ATT 


GCG 


TGC 


TCG 


AGG 


GTC 


CGC 


asp 


ile ala cys ser arg val ar< 


GCG 


GGC 


GAC 


TCT 


GGC 


GTC 


GTT 


AGC 


ala 


gly 


asp 


ser 


gly 


val 


val 


ser 


TGC 


TTT 


TAA 


CCG 


ACC 


GGA 


TCC 


AGA 


cys 


phe 


OCH 


pro 


thr 


gly 


ser 


arg 



SEQ ID N° 6C 
FIGURE 6C 



CCG TCG 


GCA 


ACT TGG 


CCG 


CTG AGG TCG 


GCT 


pro ser 


ala 


thr trp 


pro 


leu 


arg 


ser 


ala 


61/21 














AGC GGC 


TCC 


ATC GGC 


TTT 


GCT 


GGT 


AGC 


GGT 


ser gly 


ser 


ile gly 


phe 


ala 


gly 


ser 


gly 


121/41 














TGG CCG 


GTG 


ATA TAT 


TCG 


GTC 


AGA 


CGG 


GTA 


trp pro 


val 


ile tyr 


trp 


val 


arg 


arg 


val 


181/61 












CGC CGC 


GGT 


GCT CGA 


GCC 


AGG 


CTT 


ACG 


ACC 


arg arg 


gly 


ala arg 


ala 


arg 


leu 


thr 


thr 


241/81 














CTT GTA 


TCT 


CTT CTC 


CGT 


GCC 


ACC 


CCC 


TAG 


leu val 


ser 


leu leu 


arg 


ala 


thr 


pro 


AMB 


301/101 












AGG TTC 


ACC 


AGG TCT 


CAC 


CAG 


ATC 






arg phe 


thr 


arg ser 


his 


gin ile 







31/11 


















TGA TCC 


CTG 


GGC 


CGA 


GGC 


GGG 


TCA 


GCC 


AAT 


OPA ser 
91/31 


leu 


gly 


arg 


gly 


gly 


ser 


ala 


asn 


TCG GCG 


GGA 


AGC 


TAG 


CGG 


CGA 


CGT 


TGT 


CGG 


ser ala 
151/51 


gly 


ser 


AMB 


arg 


arg 


arg 


cys 


arg 


TGG CGG 


CGG 


CTG 


AGG 


TGA 


TCT 


GCG 


ACA 


CGC 


trp arg 
211/71 


arg 


leu 


arg 


OPA 


ser 


ala 


thr 


arg 


AGG GAA 


TTT 


CGA 


AAA 


TGT 


TAT 


TCA 


GAA 


CAT 


arg glu 
271/91 


phe 


arg 


lys 


cys 


tyr 


ser 


glu 


his 


GTG TAG 


TGT 


TTT 


CGA 


GTA 


CCG 


GCA 


GAT 


CCC 


val AMB 


cys 


phe 


arg 


val 


pro 


ala 


asp 


pro 



SEQ ID N° 7A 
FIGURE 7A 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CGT CGG 

\*\J X www 


CAA 


wA X 




CGC 


TGA 


a m a ret 


gin 


J- w Li 


gly 


arg 


OPA 


62/21 












GCG GCT 

www ww X 


CCA 


TCG 


GCT 

VJV-> X 


TTG 


CTG 


ala ala 


pro 


ser 


ala 


leu 


leu 


122/41 












GGC CGG 


TGA 


TAT 


ATT 


GGG 


TCA 


gly arg 


OPA 


tyr 


ile 


gly 


ser 


182/61 












GCC GCG 


GTG 


CTC 


GAG 


CCA 


GGC 


ala ala 


val 


leu 


glu 


pro gly 


242/81 












TTG TAT 


CTC 


TTC 


TCC 


GTG 


CCA 


leu tyr 


leu 


phe 


ser 


val 


pro 


302/101 












GGT TCA 


CCA 


GGT 


CTC 


ACC 


AGA 


gly ser 


pro 


gly 


leu 


thr 


arg 


GTC GGC 

y» w www 


AAC 


i f u vG 

X X \J 


GCC 

www 


GCT 


GAG 


val gly 


asn 


1 »11 


aid 


ala glu 


63/21 












CGG CTC 

WVJV7 w X w 


CAT 




wJL 1 


TGC 


TGG 


arg leu 


his 


arq 


leu 


cys 


trp 


123/41 












GCC GGT 


GAT 


ATA 


TTG 


GGT 


CAG 


ala gly 


asp 


ile 


leu 


gly gin 


183/61 












CCG CGG 


TGC 


TCG 


AGC 


CAG 


GCT 


pro arg 


cys 


ser 


ser 


gin ala 


243/81 












TGT ATC 


TCT 


TCT 


CCG 


TGC 


CAC 


cys ile 


ser 


ser 


pro 


cys 


his 


303/101 










GTT CAC 


CAG 


GTC 


TCA 


CCA 


GAT 


val his 


gin 


val 


ser 


pro 


asp 



21/185 









32/11 




GGT 


CGG 


CTT 

w X X 


GAT CCC 


TGG 


gly arg 


leu 


asp pro 


trp 








92/31 




GTA 


GCG 


GTT 


CGG CGG 


GAA 


val 


ala 


val 


arg arg glu 








152/51 




GAC 


GGG 


TAT 


GGC GGC 


GGC 


asp gly 


tyr 


gly gly gly 








212/71 




TTA 


CGA 


CCA 


GGG AAT 


TTC 


leu 


arg 


pro 


gly asn 


phe. 








272/91 




CCC 


CCT 


AGG 


TGT AGT 


GTT 


pro 


pro 


arg 


cys ser 


val 


TC 











SEQ ID N° 7B 
FIGURE 7B 







33/11 




GTC GGC 


TTG 


ATC CCT 


GGG 


val gly 


leu 


ile pro gly 






93/31 




TAG CGG 


TTC 


GGC GGG 


AAG 


AMB arg 


phe 


g!y giy iys 






153/51 




ACG GGT 


ATG 


GCG GCG 


GCT 


thr gly 


met 


ala ala 


ala 






213/71 




TAC GAC 


CAG 


GGA ATT 


TCG 


tyr asp 


gin 


gly ile 


ser 






273/91 




CCC CTA 


GGT 


GTA GTG 


TTT 


pro leu 


gly 


val val 


phe 



C 



SEQ ID N° 7C 
FIGURE 7C 



GCC GAG 


GCG 


GGT CAG 


CCA ATA 


ala glu ala 


gly gin 


pro 


ile 


GCT AGC 


GGC 


GAC GTT 


GTC 


GGT 


ala ser 


gly 


asp val 


val 


gly 


TGA GGT 


GAT 


CTG CGA 


CAC 


GCC 


OPA gly asp 


leu arg 


his 


ala 


GAA AAT 


GTT 


ATT CAG 


AAC 


ATC 


glu asn 


val 


ile gin 


asn 


ile 


TTC GAG 


TAC 


CGG CAG 


ATC 


CCA 


phe glu 


tyr 


arg gin 


ile 


pro 



CCG 


AGG 


CGG 


GTC AGC 


CAA 


TAG 


pro 


arq 


arg 


val ser 


gin AMB 


CTA 


GCG 


GCG 


ACG TTG 


TCG 


GTG 


leu 


ala 


ala 


thr leu 


ser 


val 


GAG 


GTG 


ATC 


TGC GAC 


ACG 


CCG 


glu 


val 


ile 


cys asp 


thr 


pro 


AAA ATG 


TTA 


TTC AGA 


ACA 


TCT 


lys met leu 


phe arg 


thr 


ser 


TCG 


AGT 


ACC 


GGC AGA 


TCC 


CAG 


ser 


ser 


thr 


gly arg 


ser 


gin 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



22/185 



CTT TGC 


GTG 


ATG 


leu cys 


val 


met 


61/21 






TAG TTT 


TCG 


CGA 


AMR nhe 


ser 


arg 


121/41 






AGC GAA 


CCG 


TCG 


sec glu 


pro 


ser 


181/61 

191/ OX 






CGT TCC 


TGG 


GTT 


arg ser 


trp 


val 


241/81 








TGG 




ala ser 


trp 


leu 


301/101 






CGC GAA 


ACG 


TCA 


arg glu 


thr 


ser 


361/121 






ACG GTC 


GGG 


CGC 


thr val 


gly 


arg 


421/141 






TCG GCG 


ACG 


ATC 


ser ala 


thr 


ile 



TCC AAT GGC GAA 
ser asn gly glu 

TGA CGC TCG TTC 
OPA arg ser phe 

ATT CCA TGG GTG 
ile pro trp val 

CGA CAC CAT TCG 
arg his his ser 

CCG CCC CAC TAG 
pro pro his AMB 

CCG CGT TCG GGG 
pro arg ser gly 

CAT CGA CGC CGG 
his arg arg arg 



31/11 
AAC GAC GCC TTG 
asn asp ala leu 

91/31 
TGA CCG GAC TTG 
OPA pro asp leu 

151/51 
TCG ACG CAT TCG 
ser thr his ser 

211/71 
CCC AAA TCG ACC 
pro lys ser thr 

271/91 
CGA CTG CGC CGT 
arg leu arg arg 

331/111 
CAC CAG AGC ACG 
his gin ser thr 

391/131 
ACG AGG TCG CGG 
thr arg ser arg 



TCA TCG CAA TCG 
ser ser gin ser 

TGA ACG GGT TTC 
OPA thr gly phe 

TGG TCA AGG CCG 
trp ser arg pro 

TGC CCC AGG TTG 
cys pro arg leu 

CGA CGA TCC GGC 
arg arg ser gly 

GAC CCG GCA TGC 
asp pro ala cys 

TGT CGA GCA CGC 
cys arg ala arg 



TCA 


GCA 


CCG 


GCC 


ser 


ala 


pro 


ala 


GGG 


TCG 


AGG 


CCG 


gly 


ser 


arg 


pro 


GCG 


CGG 


CAG 


GAC 


ala 


arg 


gin asp 


CTC 


GTG 


CGC 


CTG 


leu 


val 


arg 


leu 


AGG 


GCA 


CGT 


CAG 


arg 


ala 


arg 


gin 


CGC 


GGG 


TCT 


CGG 


arg 


gly 


ser 


arg 


TGG 


GCC 


GAA ACC 


trp 


ala 


glu thr 



SEQ ID N° 8A 
FIGURE 8A 



TTT GCG 


TGA 


TGT 


phe ala 


OPA 


cys 


62/21 






AGT TTT 


CGC 


GAT 


ser phe 


arg 


asp 


122/41 






GCG AAC 


CGT 


CGA 


ala asn 


arg 


arg 


182/61 






GTT CCT 


GGG 


TTC 


val pro 


gly 


phe 


242/81 






CGT CTT 


GGC 


TGC 


arg leu 


gly 


cys 


302/101 






GCG AAA 


CGT 


CAC 


ala lys 


arg 


his 


362/121 






CGG TCG 


GGC 


GCC 


arg ser 


gly 


ala 


422/141 






CGG CGA 


CGA 


TC 


arg arg 


arg 





CCA ATG GCG AAA 
pro met ala lys 

GAC GCT CGT TCT 
asp ala arg ser 

TTC CAT GGG TGT 
phe his gly cys 

GAC ACC ATT CGC 
asp thr ile arg 

CGC CCC ACT AGC 
arg pro thr ser 

CGC GTT CGG GGC 
arg val arg gly 

ATC GAC GCC GGA 
ile asp ala gly 







32/11 


ACG 


ACG 


CCT TGT 


thr 


thr 


pro cys 






92/31 


GAC 


CGG 


ACT TGT 


asp 


arg 


thr cys 






152/51 


CGA 


CGC 


ATT CGT 


arg 


arg 


ile arg 






212/71 


CCA 


AAT 


CGA CCT 


pro 


asn 


arg pro 






272/91 


GAC 


TGC 


GCC GTC 


asp 


cys 


ala val 






332/111 


ACC 


AGA 


GCA CGG 


thr 


arg 


ala arg 






392/131 


CGA 


GGT 


CGC GGT 


arg 


gly 


arg gly 



CAT CGC AAT CGT 
his arg asn arg 

GAA CGG GTT TCG 
glu arg val ser 

GGT CAA GGC CGG 
gly gin gly arg 

GCC CCA GGT TGC 
ala pro gly cys 

GAC GAT CCG GCA 
asp asp pro ala 

ACC CGG CAT GCC 
thr arg his ala 

GTC GAG CAC GCT 
val glu his ala 



CAG 


CAC 


CGG 


CCT 


gin 


his 


arg 


pro 


GGT 


CGA 


GGC 


CGA 


gly 


arg 


gly arg 


CGC 


GGC 


AGG 


ACC 


arg 


gly 


arg 


thr 


TCG 


TGC 


GCC 


TGG 


ser 


cys 


ala 


trp 


GGG 


CAC 


GTC 


AGC 


gly 


his 


val 


ser 


GCG 


GGT 


CTC 


GGA 


ala 


gly 


leu gly 


GGG 


CCG 


AAA CCT 


gly 


pro 


lys 


pro 



SEQ ID N° 8B 
FEUILLE DE REMf¥4$EJ£EgI (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



23/185 



33/11 

TTG CGT GAT GTC CAA TGG CGA AAA CGA CGC CTT GTC ATC GCA ATC GTC AGC ACC GGC CTA 
leu arg asp val gin trp arg lys arg arg leu val ile ala ile val ser thr gly leu 
63/21 93/31 

GTT TTC GCG ATG ACG CTC GTT CTG ACC GGA CTT GTG AAC GGG TTT CGG GTC GAG GCC GAG 
val phe ala met thr leu val leu thr gly leu val asn gly phe arg val glu ala qlu 
123/41 153/51 

CGA ACC GTC GAT TCC ATG GGT GTC GAC GCA TTC GTG GTC AAG GCC GGC GCG GCA GGA CCG 

183/61* ^ ^ 9ly ala gly Pr ° 

TTC CTG GGT TCG ACA CCA TTC GCC CAA ATC GAC CTG CCC CAG GTT GCT CGT GCG CCT GGC 
phe leu gly ser thr pro phe ala gin ile asp leu pro gin val ala arg ala pro qlv 
243/81 273/91 

GTC TTG GCT GCC GCC CCA CTA GCG ACT GCG CCG TCG ACG ATC CGG CAG GGC ACG TCA GCG 
val leu ala ala ala pro leu ala thr ala pro ser thr ile arg gin gly thr ser ala 
303/101 333/111 

CGA AAC GTC ACC GCG TTC GGG GCA CCA GAG CAC GGA CCC GGC ATG CCG CGG GTC TCG GAC 
arg asn val thr ala phe gly ala pro glu his gly pro gly met pro arg val ser asD 
363/121 393/131 

GGT CGG GCG CCA TCG ACG CCG GAC GAG GTC GCG GTG TCG AGC ACG CTG GGC CGA AAC CTC 
gly arg ala pro ser thr pro asp glu val ala val ser ser thr leu gly arq asn leu 
423/141 * 1 y 

GGC GAC GAT C 
gly asp asp 

SEQ ID N° 8C 
FIGURE 8C 



partie de la sequence nucleotidique de seq8A 
1/1 31/11 

CAG GTT GCT CGT GCG CCT GGC GTC TTG GCT GCC GCC CCA CTA GCG ACT GCG CCG TCG ACG 
gin val ala arg ala pro gly val leu ala ala ala pro leu ala thr ala pro ser thr 
61/21 91/ 31 

ATC CGG CAG GGC ACG TCA GCG CGA AAC GTC ACC GCG TTC GGG GCA CCA GAG CAC GGA CCC 
ile arg gin gly thr ser ala arg asn val thr ala phe gly ala pro glu his gly pro 
121/41 151/51 

GGC ATG CCG CGG GTC TCG GAC GGT CGG GCG CCA TCG ACG CCG GAC GAG GTC GCG GTG TCG 
gly met pro arg val ser asp gly arg ala pro ser thr pro asp glu val ala val ser 
181/ 61 

AGC ACG CTG GGC CGA AAC CTC GGC GAC GAT C 
ser thr leu gly arg asn leu gly asp asp 

SEQ ID N° 8A f 



FIGURE 8A» 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



24/185 



PCT/FR98/01813 



1/1 31/11 

AGG TTG CTC GTG CGC CTG GCG TCT TGG CTG CCG CCC CAC TAG CGA CTG CGC CGT CGA CGA 
arg leu leu val arg leu ala ser trp leu pro pro his AMB arg leu arg arg arq aro 
61/21 91/31 9 

TCC GGC AGG GCA CGT CAG CGC GAA ACG TCA CCG CGT TCG GGG CAC CAG AGC ACG GAC CCG 
ser gly arg ala arg gin arg glu thr ser pro arg ser gly his gin ser thr asp pro 
121/41 151/51 

GCA TGC CGC GGG TCT CGG ACG GTC GGG CGC CAT CGA CGC CGG ACG AGG TCG CGG TGT CGA 
ala cys arg gly ser arg thr val gly arg his arg arg arg thr arg ser arg cys arg 
181/61 

GCA CGC TGG GCC GAA ACC TCG GCG ACG ATC 
ala arg trp ala glu thr ser ala thr ile 



SEQ ID N° 8B' 
FIGURE 8B» 



Seq8C 



1/1 














31/11 














CCA GGT 


TGC 


TCG TGC GCC 


TGG 


CGT 


CTT 


GGC 


TGC CGC 


CCC 


ACT AGC GAC 


TGC 


GCC 


GTC 


GAC 


pro gly cys 


ser cys ala 


trp 


arg 


leu 


gly 


cys arg 


pro 


thr ser asp 


cys 


ala 


val 


asp 


61/21 














91/31 










GAT CCG 


GCA 


GGG CAC GTC 


AGC 


GCG 


AAA 


CGT 


CAC CGC 


GTT 


CGG GGC ACC 


AGA 


GCA 


CGG 


ACC 


asp pro 


ala 


gly his val 


ser 


ala lys 


arg 


his arg 


val 


arg giy thr 


arg 


ala 


arg 


thr 


121/41 














151/51 








CGG CAT 


GCC 


GCG GGT CTC 


GGA 


CGG 


TCG 


GGC. 


GCC ATC 


GAC 


GCC GGA CGA 


GGT 


CGC 


GGT 


GTC 


arg his 
181/61 


ala 


ala gly leu gly 


arg 


ser 


gly 


ala ile 


asp 


ala gly arg gly 


arg 


gly val 


GAG CAC 


GCT 


GGG CCG AAA 


CCT 


CGG 


CGA 


CGA 


TC 














glu his 


ala 


gly pro lys 


pro 


arg 


arg 


arg 

















SEQ ID N° 8C 
FIGURE 8C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



sequence Rv2563 


predite 


par 


atg 












met 












121/41 












ctt ttt 


gcg 


get 


ttg 


cgt 


gat 


leu phe 


ala 


ala 


leu 


arg 


aso 


181/61 












age acc 


ggc 


eta 


gtt 


ttc 


aca 


ser thr 


gly 


leu 


val 


phe 


ala 


241/81 












gtc gag 


gec 


gag 


cga 


acc 


gtc 


val glu 


ala 


glu 


arg 


thr 


val 


301/101 












gcg gca 


gga 


ccg 


ttc 


ctg 




ala ala 


gly 


pro 


phe 


leu 


al v 


361/121 












cgt gcg 


cct 


ggc 


gtc 


ttg 


get 


arg ala 


pro 


gly 


val 


leu 


ala 


421/141 












ggc acg 


tea 


gcg 


cga 


aac 




gly thr 


ser 


ala 


arg 


asn 


val 


481/161 












egg gtc 


teg 


gac 


ggt 


egg 




arg val 


ser 


asp 


gly 


arg 


ala 


541/181 












ggc cga 


aac 


etc 


ggc 


gac 


gat 


gly arg 


asn 


leu 


gly 


asp 


asD 


601/201 












gtg ccc 


gag 


tea 


acc 


gcg 


ctg 


val pro 


glu 


ser 


thr 


ala 


leu 


661/221 












cag cag 


ttg 


gca 


tac 


aac 




gin gin 


leu 


ala 


tyr 


asn 




721/241 












cga cag 


etc 


ccg 


gac 


ggc 




arg gin 


leu 


pro 


asp 


gly 


tvr 


781/261 












cgc ccg 


ttg 


aag 


gtc 


gcg 




arg pro 


leu 


lys 


val 


ala 


val 


841/281 












gcg gcg 


ttg 


ate 


gtc 


ggc 


teg 


ala ala 


leu 


ile 


val 


gly 


ser 


901/301 










gcg gtg 


ttc 


aag 


gcg 


ate 


aac 


ala val 


phe 


lys 


ala 


ile 


olv 


961/321 












gcg gtc 


gtc 


gtc 


gcg 


ctg 


etc 


ala val 


val 


val 


ala 


leu 


leu 


1021/341 










ccg ttg 


ttc 


ccg 


atg 


act 


gtc 


pro leu 


phe 


pro 


met 


thr 


val 


1081/361 










gcg act 


gtg 


ate 


ggt 


ctg 


ctg 


ala thr 


val 


ile 


gly 


leu 


leu 


1141/381 








ccg gca 


eta 


gcg 


ttc 


gga 


ggt 


pro ala 


leu 


ala 


phe 


gly 


gly 



25/185 



Cole et 


al. 


(Nature 


393; 








151/51 




gtc 


caa 


tacr 


cga aaa 


cga 


val 


gin 


tro 


arg lys arg 








211/71 




atg 


acg 


etc 


gtt ctg 


acc 


met 


thr 


leu 


val leu 


t-U y 

tnr 








971 /Ql 

£ ' XI 7X 




gat 


tec 


ata 


ggt gtc 


gac 


asp 


ser 


met 


gly val 


asp 








ooi /111 
OJA/ 111 




teg 


aca 


cca 


ttc gee 


caa 


ser 


thr 


pro 


phe ala 


gin 












gee 


gee 


cca 


tid gcg 


act 


ala 


ala 


pro 


leu ala 


thr 








hOL/ xDx 




acc 


gcg 


ttc 


ggg gca 


cca 


thr 


ala 




gly ala 


pro 








311/ 1/1 




cca 


teg 


acg 


ccg gac 


gag 


pro 


ser 


thr 


pro asp 


glu 








d / i/ iy i 




ctg 


caa 


ata 


ggt gcg 


cgc 


leu 


gin 


val 


gly ala 


arg 








Dj X/ £. X X 




gca 


aag 


att 


ccc aac 


ate 


ala 


lys 


ile 


pro asn 


He 












cag 


ccg 


aca 


a tr* arrt" 
a v.. ay v_ 


tcy 


gin 


pro 


thr 


lip ca r 


ser 








751/251 




cag 


acc 


gtc 


aat cga 


gcg 


gin 


thr 


val 


asn arg 


ala 








811/271 




gat 


gcg 


ate 


acg gtt 


gtg 


asp 


ala 


ile 


thr val 


val 








871/291 




gtg 


gtc 


tac 


etc tct 


gcg 


val 


val 


tyr 


leu ser 


ala 








931/311 




gtg 


ccg 


aca 


cgc teg 


att 


val 


pro 


thr 


arg ser 


ile 








991/331 




gcg 


gcg 


gtg 


gtt ggc 


ggc 


ala 


ala 


val 


val gly 


gly 








1051/351 


gtg 


gta 


ccc 


ctg agt 


gee 


val 


val 


pro 


leu ser 


ala 








1111/371 


gee 


age 


gtc 


gca gga 


ctg 


ala 


ser 


val 


ala gly 


leu 



ccc tag 
pro AM3 

SEQ ID N° 8D 



537-544) et contenant seq8A' 



cgc ctt gtc ate gca ate gtc 
arg leu val ile ala ile val 

gga ctt gtg aac ggg ttt egg 
gly leu val asn gly phe arg 

gca ttc gtg gtc aag gee ggc 
ala phe val val lys ala gly 

ate gac ctg ccc cag gtt get 
ile asp leu pro gin val ala 

gcg ccg teg acg ate egg cag 
ala pro ser thr ile arg gin 

gag cac gga ccc ggc atg ccg 
glu his gly pro gly met pro 

gtc gcg gtg teg age acg ctg 
val ala val ser ser thr leu 

act ttg egg ate gtc ggc ate 
thr leu arg ile val gly ile 

ttc ctg acc acc gaa ggc eta 
phe leu thr thr glu gly leu 

ate ggg ate gac ggg atg ccc 
ile gly ile asp gly met pro 

gat get gtc age gat ctg atg 
asp ala val ser asp leu met 

gcg gtc ttg ctg tgg ate gtt 
ala val leu leu trp ile val 

ttg gag egg ctg cgt gac ttt 
leu glu arg leu arg asp phe 

ctg gec ggg ctg gcg ctg cag 
leu ala gly leu ala leu gin 

ate ctt teg ctg etc ttg gcg 
ile leu ser leu leu leu ala 

ttc gtg gcg eta ccg gcg ate 
phe val ala leu pro ala ile 

egg cgc gtg gtg gcg ate gat 
arg arg val val ala ile asp 



FEUILLE DE REMflJOSgfflEfl? (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



tag gtt 


tea 


aga 


agg 


cct 


gtg 


cag 


AMB val 


ser 


arg 


arg 


pro 


val 


gin 


61/21 














ccg ccg 


aaa 


tgg 


get 


aat 


egg 


gtt 


pro pro 


lys 


trp 


ala 


asn 


arg 


val 


121/41 












acc gac 


ccc 


etc 


acc 


teg 


gtc 


gaa 


thr asp 


pro 


leu 


thr 


ser 


val 


glu 


181/61 












cat ttg 


att 


ggg 


tec 


acg 


gaa 


gca 


his leu 


ile 


gly 


ser 


thr 


glu 


ala 



tgg 
trp 


gcc 
ala 


gcg 
ala 


gcg 
ala 


cca 
pro 


ccg 
pro 


aag 
lys 


age 
ser 


teg 
ser 


ccg 
pro 


atg 
met 


ate 
ile 


teg 
ser 


acc 
thr 


gcc 
ala 


acg 
thr 


aac 
asn 


gcg 
ala 


gca 
ala 


acg 
thr 


cca 
pro 


gcc 
ala 


cat 
his 


gat 
asp 


cgc 
arg 


atg 
met 


ctt 
leu 


ttt 
phe 


gcg 
ala 


get 
ala 


ttg 
leu 


cgt 
arg 


ate 
ile 


gtc 
val 


age 
ser 


acc 
thr 


ggc 
gly 


eta 
leu 


gtt 
val 


ttc 
phe 


ttt 
phe 


egg 
arg 


gtc 
val 


gag 
glu 


gcc 
ala 


gag 
glu 


cga 
arg 


ace 
thr 


gcc 
ala 


ggc 
gly 


gcg 
ala 


gca 
ala 


gga 
gly 


ccg 
pro 


ttc 
phe 


ctg 
leu 


gtt 
val 


get 
ala 


cgt 
arg 


gcg 
ala 


cct 
pro 


ggc 
gly 


gtc 
val 


ttg 
leu 



26/185 

ORF predite par_Cole et al. (Nature 393:537-544) et contenant Rv2563 
1/1 31/11 

: tec gca gcc 
l ser ala ala 

91/31 
: ttg get cga 
r leu ala arg 

151/51 
: egg cga acc 
> arg arg thr 

211/71 
: age ttc cgt 
j ser phe arg 
241/81 271/91 
gat gtc caa tgg cga aaa cga cgc ctt gtc ate gca 
asp val gin trp arg lys arg arg leu val ile ala 
301/101 331/111 
gcg atg acg etc gtt ctg acc gga ctt gtg aac ggg 
ala met thr leu val leu thr gly leu val asn gly 
361/121 * 391/131 

gtc gat tec atg ggt gtc gac gca ttc gtg gtc aag 
val asp ser met gly val asp ala phe val val lys 
421/141 451/151 
ggt teg aca cca ttc gcc caa ate gac ctg ccc cag 
gly ser thr pro phe ala gin ile asp leu pro gin 
481/161 511/171 
get gcc gcc cca eta gcg act gcg ccg teg acg ate egg cag ggc acg tea gcg cga aac 
ala ala ala pro leu ala thr ala pro ser thr ile arg gin gly thr ser ala arq asn 
541/101 571/191 

gtc acc gcg ttc ggg gca cca gag cac gga ccc ggc atg ccg egg gtc teg gac ggt egg 
val thr ala phe gly ala pro glu his gly pro gly met pro arg val ser asp gly arg 
601/201 631/211 

gcg cca teg acg ccg gac gag gtc gcg gtg teg age acg ctg ggc cga aac etc ggc gac 
ala pro ser thr pro asp glu val ala val ser ser thr leu gly arg asn leu gly asp 
661/221 691/231 

gat ctg caa gtg ggt gcg cgc act ttg egg ate gtc ggc ate gtg ccc gag tea acc gcg 
asp leu gin val gly ala arg thr leu arg ile val gly ile val pro glu ser thr ala 
721/241 751/251 

ctg gca aag att ccc aac ate ttc ctg acc acc gaa ggc eta cag cag ttg gca tac aac 
leu ala lys ile pro asn ile phe leu thr thr glu gly leu gin gin leu ala tyr asn 
781/261 811/271 

gga cag ccg aca ate agt teg ate ggg ate gac ggg atg ccc cga cag etc ccg gac ggc 
gly gin pro thr ile ser ser ile gly ile asp gly met pro arg gin leu pro asp alv 
841/281 871/291 

tat cag acc gtc aat cga gcg gat get gtc age gat ctg atg cgc ccg ttg aag gtc gcg 
tyr gin thr val asn arg ala asp ala val ser asp leu met arg pro leu lys val ala 
901/301 931/311 

gtg gat gcg ate acg gtt gtg gcg gtc ttg ctg tgg ate gtt gcg gcg ttg ate gtc ggc 
val asp ala ile thr val val ala val leu leu trp ile val ala ala leu ile val alv 
961/321 991/331 

teg gtg gtc tac etc tct gcg ttg gag egg ctg cgt gac ttt gcg gtg ttc aag gcg ate 
ser val val tyr leu ser ala leu glu arg leu arg asp phe ala val phe lys ala ile 
1021/341 1051/351 

ggc gtg ccg acg cgc teg att ctg gcc ggg ctg gcg ctg cag gcg gtc gtc gtc gcg ctg 
gly val pro thr arg ser ile leu ala gly leu ala leu gin ala val val val ala leu 
1081/361 1111/371 



etc gcg gcg 


gtg 


gtt 


ggc 


ggc 


ate 


ctt 


teg 


ctg ctg ttg 


gcg 


leu ala ala 


val 


val 


gly 


gly 


ile 


leu 


ser 


leu leu leu 


ala 


1141/381 
















1171/391 




gtc gtg gta 


ccc 


ctg 


agt 


gcc 


ttc 


gtg 


gcg 


eta ccg gcg 


ate 


val val val 


pro 


leu 


ser 


ala 


phe 


val 


ala 


leu pro ala 


ile 


1201/401 
















1231/411 




ctg gcc age 


gtc 


gca 


gga 


ctg 


egg 


cgc 


gtg 


gtg gcg ate 


gat 


leu ala ser 


val 


ala 


gly 


leu 


arg 


arg 


val 


val ala ile 


asp 



1261/421 - P^e gly 

ggt ccc tag 
gly pro AMB 

SEQ ID N° 8F 
FEUILLE DE REMflKSSfflEflT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



27/185 



sequence de Rv0072 predite par par Cole et 
presentant plus de 77% de similarity avec Seq8D' 
1/1 31/11 
atg etc ttc gcg gee ctg cgt gac atg caa tgg aga aag cgc 
Met leu phe ala ala leu arg asp met gin trp arg lys arg 
61/21 ~ 91/31 

ate age ace ggg ctg ate ttc ggg atg acg ctt gtt ttg ace 
ile ser thr gly leu ile phe gly met thr leu val leu thr 
121/41 151/5! 
egg gtg gag gee egg cac ace gtc gat tec atg ggt gtc gat 
arg val glu ala arg his thr val asp ser met gly val asp 
181/61 211/71 
ggc get get gga cct ttt ctg ggt tea ata ccg ttt ccc gat 
gly ala ala gly pro phe leu gly ser ile pro phe pro asp 
241/81 271/91 
gee get gaa ccc ggt gtc atg gee gcg gee ccg ttg ggc age 
ala ala glu pro gly val met ala ala ala pro leu gly ser 
301/101 331/111 
gaa ggc acg teg acg cga aac gtc acg gtc ttc ggc gcg ccc 
glu gly thr ser thr arg asn val thr val phe gly ala pro 
361/121 391/131 
cca egg gtc tea gag ggt egg tea ccg teg aaa ccg gac gaa 
pro arg val ser glu gly arg ser pro ser lys pro asp glu 
421/141 451/151 
atg ggc cga cac etc ggt gac act gtc gag gtc ggc gcg cgc 
met gly arg his leu gly asp thr val glu val gly ala arg 
481/161 511/171 
att gtg ccg aat tec ace gcg ctg gee aag ate ccc aat gtc 
ile val pro asn ser thr ala leu ala lys ile pro asn val 
541/181 . 571/191 

tta cag aaa ttg gcg tac aac ggg cag ccg aat ate acg tec 
leu gin lys leu ala tyr asn gly gin pro asn ile thr ser 
601/201 631/211 
ccc cga cag ctg ccg gag ggt tac cag act ttc gat egg gtg 
pro arg gin leu pro glu gly tyr gin thr phe asp arg val 
661/221 691/231 
gtg cgc cca ttg aag gtc gca gtg aat teg ate teg ate gtg 
val arg pro leu lys val ala val asn ser ile ser ile val 
721/241 751/251 
gtg gcg gtg ctg ate gtc ggc teg gtg gtg tac ctt teg get 
val ala val leu ile val gly ser val val tyr leu ser ala 
781/261 811/271 
ttc gcg gtg ttc aag gcg att ggc acg cca acg cgc teg att 
phe ala val phe lys ala ile gly thr pro thr arg ser ile 
841/281 871/291 
cag gcg ctg gtc att gcg ttg ctt gcg gcg gtg gtg ggc gtc 
gin ala leu val ile ala leu leu ala ala val val gly val 
901/301 931/311 
gca cca ctg ttt ccg atg att gtc gcg gta ccc gtc ggt get 
ala pro leu phe pro met ile val ala val pro val gly ala 
961/321 991/331 
gee gcg ate gtc ate ggt ctg ttc get agt gtt gec gga ttg 
ala ala ile val ile gly leu phe ala ser val ala gly leu 
1021/341 

gat ccc gcg cag gcg ttc gga ggt ccc tag 
asp pro ala gin ala phe gly gly pro AMB 



al. (Nature 393:537-544) et 



cgc 
arg 


ctg 
leu 


gtc 
val 


ate 
ile 


acg 
thr 


ate 
ile 


gga 
gly 


etc 
leu 


gcg 
ala 


aac 
asn 


ggc 
gly 


ttc 
phe 


gta 
val 


ttc 
phe 


gtc 
val 


gtc 
val 


aga 
arg 


tec 
ser 


gtt 
val 


gac 
asp 


ctg 
leu 


gee 
ala 


cga 
arg 


gtg 
val 


gtg 
val 


ggg 
gly 


acg 
thr 


ate 
ile 


atg 
met 


aaa 
lys 


gag 
glu 


cac 
his 


gga 
gly 


cct 
pro 


ggc 
qlv 


atg 
met 


gtc 
val 


gcg 
ala 


gca 
ala 


teg 
ser 


age 
ser 


acg 
thr 


aga 
arg 


ttg 
leu 


egg 
arg 


gtc 
val 


gtt 
val 


ggc 
gly 


ttc 
phe 


etc 
leu 


acg 
thr 


ace 
thr 


gag 
glu 


ggc 
gly 


ate 
ile 


ggg 

gly 


ate 
ile 


ata 
ile 


ggt 
gly 


atg 
met 


ggc 
gly 


get 
ala 


gtc 
val 


aat 
asn 


gat 
asp 


ttg 
leu 


get 
ala 


gtt 
val 


ttg 
leu 


ctg 
leu 


tgg 
trp 


att 
ile 


ctt 
leu 


gag 
glu 


egg 
arg 


eta 
leu 


cgt 
arg 


gac 
asp 


atg 
met 


gee 
ala 


ggg 

gly 


etc 
leu 


gca 
ala 


tta 
leu 


gtc 
val 


ctg 
leu 


gcg 
ala 


cag 
gin 


gtg 
val 


ttg 
leu 


tac 
tyr 


ctg 
leu 


gcg 
ala 


eta 
leu 


ccg 
pro 


gtg 
val 


aag 
lys 


cgc 
arg 


gtg 
val 


gtg 
val 


acg 
thr 


gtc 
val 



SEQ ID N° 8G 



FEUILLE DE REMPO©gME#P(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



28/185 



Seq8H : ORF predite par Cole et al. (Nature 393:537-544) et contenant seq8G 
1/1 31/11 

tag cct ctg gga atg etc ttc gcg gec ctg cgt gac atg caa tgg aga aag cgc cgc ctg 
AMB pro leu gly met leu phe ala ala leu arg asp met gin trp arg lys arq are leu 
61/21 91/ 31 * * J 9 tgAeu 

gtc ate acg ate ate age acc ggg ctg ate ttc ggg atg acg ctt gtt ttg ace gga etc 
val ile thr ile ile ser thr gly leu ile phe gly met thr leu val leu thr qly leu 
121/41 151/51 

gcg aac ggc ttc egg gtg gag gee egg cac acc gtc gat tec atg ggt gtc gat gta ttc 
ala asn gly phe arg val glu ala arg his thr val asp ser met gly val asp val phe 
181/61 211/71 

gtc gtc aga tec ggc get get gga cct ttt ctg ggt tea ata ccg ttt ccc gat gtt gac 
val val arg ser gly ala ala gly pro phe leu gly ser ile pro phe pro asp val asp 
241/81 271/91 

ctg gee cga gtg gee get gaa ccc ggt gtc atg gee gcg gee ccg ttg ggc age gtg ggg 
leu ala arg val ala ala glu pro gly val met ala ala ala pro leu gly ser val qlv 
301/101 331/111 

acg ate atg aaa gaa ggc acg teg acg cga aac gtc acg gtc ttc ggc gcg ccc gag cac 
thr ile met lys glu gly thr ser thr arg asn val thr val phe gly ala pro qlu his 
361/121 391/131 

gga cct ggc atg cca egg gtc tea gag ggt egg tea ccg teg aaa ccg gac gaa gtc gcg 
gly pro gly met pro arg val ser glu gly arg ser pro ser lys pro asp glu val ala 
421/141 451/151 

gca teg age acg atg ggc cga cac etc ggt gac act gtc gag gtc ggc gcg cgc aga ttg 
ala ser ser thr met gly arg his leu gly asp thr val glu val gly ala arg arq leu 
481/161 511/171 

egg gtc gtt ggc att gtg ccg aat tec acc gcg ctg gec aag ate ccc aat gtc ttc etc 
arg val val gly ile val pro asn ser thr ala leu ala lys ile pro asn val phe leu 
541/181 . 571/191 

acg acc gag ggc tta cag aaa ttg gcg tac aac ggg cag ccg aat ate acg tec ate ggg 
thr thr glu gly leu gin lys leu ala tyr asn gly gin pro asn ile thr ser ile qlv 
601/201 631/211 

ate ata ggt atg ccc cga cag ctg ccg gag ggt tac cag act ttc gat egg gtg ggc get 
ile ile gly met pro arg gin leu pro glu gly tyr gin thr phe asp arg val qlv ala 
661/221 691/231 

gtc aat gat ttg gtg cgc cca ttg aag gtc gca gtg aat teg ate teg ate gtg get gtt 
val asn asp leu val arg pro leu lys val ala val asn ser ile ser ile val ala val 
721/241 751/251 

ttg ctg tgg att gtg gcg gtg ctg ate gtc ggc teg gtg gtg tac ctt teg get ctt gag 
leu leu trp ile val ala val leu ile val gly ser val val tyr leu ser ala leu qlu 
781/261 811/271 

egg eta cgt gac ttc gcg gtg ttc aag gcg att ggc acg cca acg cgc teg att atg gec 
arg leu arg asp phe ala val phe lys ala ile gly thr pro thr arg ser ile met ala 
841/281 871/291 

ggg etc gca tta cag gcg ctg gtc att gcg ttg ctt gcg gcg gtg gtg ggc gtc gtc ctg 
gly leu ala leu gin ala leu val ile ala leu leu ala ala val val gly val val leu 
901/301 931/311 

gcg cag gtg ttg gca cca ctg ttt ccg atg att gtc gcg gta ccc gtc ggt get tac ctg 
ala gin val leu ala pro leu phe pro met ile val ala val pro val gly ala tyr leu 
961/321 991/331 

gcg eta ccg gtg gee gcg ate gtc ate ggt ctg ttc get agt gtt gec gga ttg aag cgc 
ala leu pro val ala ala ile val ile gly leu phe ala ser val ala gly leu lys aro 
1021/341 1051/351 Y 9 

gtg gtg acg gtc gat ccc gcg cag gcg ttc gga ggt ccc tag 
val val thr val asp pro ala gin ala phe gly gly pro AMB 



SEQ ID N° 8H 
FEUILLE DE REMFOSSffE fit* (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CGA GGC 


CGA 


GCG 


AAC 


CGT 


CGA 


ara alv 


ara 

« A. \j 


ala 


asn 


arg 


arg 


61/21 












GGC AGG 


ACC 


GTT 


CCT 


GGG 


TTC 


gly arg 


thr 


val 


pro gly 


phe 


121/41 












TGC GCC 


TGG 


CGT 


CTT 


GGC 


TGC 


cys ala 


trp 


arg 


leu gly 


cys 


181/61 












CAC GTC 


AGC 


GCG 


AAA 


CGT 


CAC 


his val 


ser 


ala 


lys arg 


his 


All/ ox 












GGT CTC 


GGA 


CGG 


TCG 


GGC 


GCC 


gly leu 


gly 


arg 


ser 


gly 


ala 


301/101 












CCG AAA 


CCT 


CGG 


CGA 


CGA 


TC 


pro lys 


pro 


arg 


arg 


arg 




GAG GCC 


GAG 


CGA 


ACC 


GTC 


GAT 


glu ala 


glu 


arq 


thr 


val 


aso 


62/21 












GCA GGA 


CCG 


TTC 


CTG 


GGT 


TCG 


ala gly 


pro 


phe 


leu 


gly 


ser 


122/41 












GCG CCT 


GGC 


GTC 


TTG 


GCT 


GCC 


ala pro 


gly 


val 


leu 


ala 


ala 


182/61 












ACG TCA 


GCG 


CGA 


AAC 


GTC 


ACC 


thr ser 


ala 


arg 


asn 


val 


thr 


242/81 












GTC TCG 


GAC 


GGT 


CGG 


GCG 


CCA 


val ser 


asp 


gly 


arg 


ala 


pro 


302/101 










CGA AAC 


CTC 


GGC 


GAC 


GAT 


C 


arg asn 


leu 


gly 


asp 


asp 





29/185 



31/11 

TTC CAT GGG TGT CGA CGC 
phe his gly cys arg arg 
91/31 

GAC ACC ATT CGC CCA AAT 
asp thr ile arg pro asn 
151/51 

CGC CCC ACT AGC GAC TGC 
arg pro thr ser asp cys 

211/71 
CGC GTT CGG GGC ACC AGA 
arg val arg gly thr arg 

271/91 
ATC GAC GCC GGA CGA GGT 
ile asp ala gly arg gly 



SEQ ID N° 9A 
FIGURE 9A 









32/11 




TCC 


ATG 


GGT 


GTC GAC 


GCA 


ser 


met 


gly 


val asp 


ala 








92/31 




ACA 


CCA 


TTC 


GCC CAA 


ATC 


thr 


pro 


phe 


ala gin 


ile 








152/51 




GCC 


CCA 


CTA 


GCG ACT 


GCG 


ala 


pro 


leu 


ala thr 


ala 








212/71 




GCG 


TTC 


GGG 


GCA CCA 


GAG 


ala phe 


gly 


ala pro 


glu 








272/91 




TCG ACG 


CCG 


GAC GAG 


GTC 


ser 


thr 


pro 


asp glu 


val 



SEQ ID N° 9B 
FIGURE 9B 



ATT 


CGT 


GGT 


CAA 


GGC 


CGG 


CGC 


ile 


arg qly gin 


mm 1 mm 

gly 


arg 


arg 


CGA 


CCT 


GCC 


CCA 


GGT 


TGC 


TCG 


arg 


pro 


ala 


pro 


gly 


cys 


ser 


GCC 


GTC 


GAC 


GAT 


CCG 


GCA 


GGG 


ala 


val 


asp 


asp 


pro 


ala 


gly 


GCA CGG ACC 


CGG 


CAT 


GCC 


GCG 


ala 


arg 


thr 


arg 


his 


ala 


ala 


CGC 


GGT 


GTC 


GAG 


CAC 


GCT 


GGG 


arg gly val glu 


his 


ala 


gly 


TTC 


GTG 


GTC 


AAG 


GCC 


GGC 


GCG 


phe 


val 


val 


lys 


ala 


gly 


ala 


GAC 


CTG 


CCC 


GAG 


GTT 


GCT 


CGT 


asp 


leu 


pro 


gin 


val 


ala 


arg 


CCG 


TCG 


ACG 


ATC 


CGG 


CAG 


GGC 


pro 


ser 


thr 


ile 


arg 


gin 


gly 


CAC 


GGA 


CCC 


GGC 


ATG 


CCG 


CGG 


his 


gly pro gly 


met 


pro 


arg 


GCG 


GTG 


TCG 


AGC 


ACG 


CTG 


GGC 


ala 


val 


ser 


ser 


thr 


leu 


gly 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



30/185 



AGG CCG 


AGC 


GAA CCG 


TCG 


ATT 


arg pro 


ser 


alu pro 


ser 


ile 


63/21 










CAG GAC 


CGT 


TCC TGG 


GTT 


CGA 


gin asp arg 


ser trp 


val 


arg 


123/41 








CGC CTG 


GCG 


TCT TGG 


CTG 


CCG 


arg leu 


ala 


ser trp 


leu 


pro 


183/61 








CGT CAG 


CGC 


VatAA. ACG 


TCA 


CCG 


arg gin 


arg 


glu thr 


ser 


pro 


243/81 








TCT CGG 


ACG 


GTC GGG 


CGC 


CAT 


ser arg 


thr 


val gly 


arg 


his 


303/101 








GAA ACC 


TCG 


GCG ACG 


ATC 




glu thr. ser 


ala thr 


ile 




TTA ACG 


ACT 


CAG ACG 


GAA ACG 


leu thr 


thr 


gin thr 


glu thr 


61/21 










GCT CTT 


TGG 


CAA TTG 


AAG 


GTG 


ala leu 


trp 


gin leu 


lys val 


121/41 










ATC AAT 


CGC 


CGG CTC 


GCG 


GAC 


ile asn 


arg 


arg leu 


ala 


asp 


181/61 








GGG TCC 


TTT 


GTG ACT 


GCC 


GGG 


gly ser 


phe 


val thr 


ala gly 


241/81 










CTA CCG 


TTC 


TGA CCT 


GGG 


GCT 


leu pro phe 


OPA pro 


gly ala 


301/101 










GGC CCA 


CCG 


CCA CCT 


CGG 


TCG 


gly pro 


pro 


pro pro 


arg 


ser 


361/121 










CTT GTT 


CGC 


ATC GTT 


GGT 


GTC 


leu val 


arg 


ile val 


gly val 


421/141 










GGC GGT 


CGT 


GCC GCG 


CAT 


GCG 


gly gly arg 


ala ala 


his 


ala 



33/11 

CCA TGG GTG TCG ACG CAT 
pro trp val ser thr his 
93/31 

CAC CAT TCG CCC AAA TCG 
his his ser pro lys ser 
153/51 

CCC CAC TAG CGA CTG CGC 
pro his AMB arg leu arg 

213/71 
CGT TCG GGG CAC CAG AGC 
arg ser gly his gin ser 

273/91 
CGA CGC CGG ACG AGG TCG 
arg arg arg thr arg ser 



SEQ ID N° 9C 
FIGURE 9C 









31/11 




CTT 


GAA 


CC6 


CGA GGT 


CGC 


leu glu 


pro 


arg gly 


arg 








91/31 




AGC 


TGC 


GAG 


CAG CCG 


GGT 


ser 


cys 


glu 


gin pro 


gly 








151/51 


GTA 


GAT 


AAT 


CAG CTC 


ACC 


val 


asp 


asn 


gin leu 


thr 








211/71 




CTT 


GAC 


GCG 


GAC GAC 


CAC 


leu 


asp 


ala 


asp asp 


his 








271/91 




GCG 


TGG 


GCG 


CCG ACG 


ACG 


ala 


trp 


ala 


pro thr 


thr 








331/111 




CCG 


GCA 


GTA 


TGT CAG 


CAT 


pro 


ala 


val 


cys gin 


his 








391/131 




GTG 


GTT 


GCG 


ACG ACC 


TTG 


val 


val 


ala 


thr thr 


leu 



GAT C 
asp 



SEQ ID N° 10A 
FIGURE 10A 



TCG 
ser 


TGG TCA AGG 
trp ser arg 


CCG 
pro 


GCG 
ala 


CGG 
arg 


ACC 
thr 


TGC CCC 
cys pro 


AGG 
arg 


TTG 
leu 


CTC 
leu 


GTG 
val 


CGT 
arg 


CGA CGA TCC 
arg arg ser 


GGC 
crlv 


AGG 
arg 


GCA 
ala 


ACG 
thr 


GAC CCG 
asp pro 


GCA 
ala 


TGC 
cys 


CGC GGG 
arg gly 


CGG 
arg 


TGT CGA 
cys arg 


GCA 
ala 


CGC 
arg 


TGG 
trp 


GCC 
ala 


TCC 
ser 


GGA CAC CAA 
gly his gin 


TTT 
phe 


GAC 
asp 


TCG 
ser 


GAC 
asp 


CGC ATC 
arg ile 


GTT 
val 


GGC 
gly 


CTT 
leu 


GCC 
ala 


GTT 
val 


GGG ACC 
gly thr 


GAC 
asp 


CTC 
leu 


GAC 
asp 


CAG 

gin 


AGA 
arg 


GTC GGT CAT 
val gly his 


CGC 
arg 


CTA AGG 
leu arg 


TGA GGC ACG 
OPA gly thr 


TCA 
ser 


TGT 
cys 


CTC 
leu 


AGC 
ser 


GTG 
val 


CAG ATG 
gin met 


ACT 
thr 


CCA 
pro 


CGC 
arg 


AGC 
ser 


GCG 
ala 


CTG GTG 
leu val 


AGC 
ser 


GCA 
ala 


CCC 
pro 


GCC 
ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



31/185 



TAA CGA 


CTC 


AGA 


CGG 


OCH arg 


leu 


arg 


arg 


62/21 








CTC TTT 


GGC 


AAT 


TGA 


leu phe 


alv 


asn 


OPA 


122/41 








TCA ATC 


GCC 


GGC 


TCG 


ser ile 


ala 




ser 


182/61 








GGT CCT 


TTG 


TGA 


CTG 


alv oro 


leu 


OPA 


leu 


242/81 








TAC CGT 


TCT 


GAC 


CTG 


tyr arg 


ser 


asp 


leu 


302/101 






GCC CAC 


CGC 


GAC 


CTC 


ala his 


arg 


his 


leu 


362/121 








TTG TTC 


GCA 


TCG 


TTG 


leu. phe 


ala 


ser 


leu 


422/141 








GCG GTC 


GTG 


CCG 


CGC 


ala val 


val 


pro 


arg 



AAA 
lys 


CGC 
arg 


TTG 
leu 


AAC 
asn 


CGC 
arg 


AGG 
arg 


TGA 
OPA 


GCT 
ala 


GCG 
ala 


AGC 
ser 


CGG 
arg 


ACG TAG 
thr AMB 


ATA 
ile 


ATC 
ile 


CCG 
pro 


GGC 
gly 


TTG 
leu 


ACG 
thr 


CGG 
arg 


GGG 
gly 


CTG 
leu 


CGT 
arg 


GGG 
gly 


CGC 
arg 


GGT 
gly 


CGC 
arg 


CGG 
arg 


CAG 
gin 


TAT 
tyr 


GTG 
val 


TCG 
ser 


TGG 
trp 


TTG 
leu 


CGA 
arg 


ATG 
met 


CGG 
arg 


ATC 
Ile 







32/11 

GAG GTC GCT CCG GAC 
glu val ala pro asp 
92/31 

AGC CGG GTG ACC GCA 
ser arg val thr ala 
152/51 

AGC TCA CCG TTG GGA 
ser ser pro leu gly 
212/71 

ACG ACC ACA GAG TCG 
thr thr thr glu ser 
272/91 

CGA CGA CGT GAG GCA 
arg arg arg glu ala 
332/111 

GTC AGC ATG TGC AGA 
val ser met cys arg 
392/131 

CGA CCT TGG CGC TGG 
arg pro trp arg trp 



ACC AAT TTG ACT CGG 
thr asn leu thr arg 

TCG TTG GCC TTG CCA 
ser leu ala leu pro 

CCG ACC TCG ACC AGG 
pro thr ser thr arg 

GTC ATC GCC TAA GGC 
val ile ala OCH gly 

CGT CAT GTC TCA GCG 
arg his val ser ala 

TGA CTC CAC GCA GCC 
OPA leu his ala ala 

TGA GCG CAC CCG CCG 
OPA ala his pro pro 



SEQ ID N° 10B 



AAC GAC 


TCA 


GAC 


asn asp 


ser 


asp 


63/21 






TCT TTG 


GCA 


ATT 


ser leu 


ala 


ile 


123/41 






CAA TCG 


CCG 


GCT 


gin ser 


pro 


ala 


183/61 






GTC CTT 


TGT 


GAC 


val leu 


cys 


asp 


243/81 






ACC GTT 


CTG 


ACC 


thr val 


leu 


thr 


303/101 






CCC ACC 


GCC 


ACC 


pro thr 


ala 


thr 


363/121 






TGT TCG 


CAT 


CGT 


cys ser 


his 


arg 


423/141 






CGG TCG 


TGC 


CGC 


arg ser 


cys 


arg 



GGA AAC GCT TGA 
gly asn ala OPA 



GAA 


GGT 


GAG CTG 


glu 


gly 


glu leu 


CGC 


GGA 


CGT AGA 


arg 


gly 


arg arg 


TGC 


CGG 


GCT TGA 


cys 


arg 


ala OPA 


TGG 


GGC 


TGC GTG 


trp 


gly 


cys val 


TCG 


GTC. 


GCC GGC 


ser 


val 


ala gly 


TGG 


TGT 


CGT GGT 


trp 


cys 


arg gly 


GCA 


TGC 


GGA TC 


ala 


cys 


gly 



FIGURE 10B 







33/11 


ACC 


GCG 


AGG TCG 


thr 


ala 


arg ser 






93/31 


CGA 


GCA 


GCC GGG 


arg 


ala 


ala gly 






153/51 


TAA 


TCA 


GCT CAC 


OCH 


ser 


ala his 






213/71 


CGC 


GGA 


CGA CCA 


arg 


gly 


arg pro 






273/91 


GGC 


GCC 


GAC GAC 


gly 


ala 


asp asp 






333/111 


AGT 


ATG 


TCA GCA 


ser 


met 


ser ala 






393/131 


TGC 


GAC 


GAC CTT 


cys 


asp 


asp leu 



CTC CGG ACA CCA 
leu arg thr pro 

TGA CCG CAT CGT 
OPA pro his arg 

CGT TGG GAC CGA 
arg trp asp arg 

CAG AGT CGG TCA 
gin ser arg ser 

GTG AGG CAC GTC 
val arg his val 

TGT GCA GAT GAC 
cys ala asp asp 

GGC GCT GGT GAG 
gly ala gly glu 



ATT TGA CTC GGC 
ile OPA leu gly 

TGG CCT TGC CAT 
trp pro cys his 

CCT CGA CCA GGG 
pro arg pro gly 

TCG CCT AAG GCT 
ser pro lys ala 

ATG TCT CAG CGG 
met ser gin arg 

TCC ACG CAG CCT 
ser thr gin pro 

CGC ACC CGC CGG 
arg thr arg arg 



SEQ ID N° IOC 



FEUILLE DE REM^^HI&eW^ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



32/185 
31/11 

CCC GAA GAG GTC CCC CGT TTT GTT AAT TTT TAA AAA ATT TGT GTC ACA AAC CGG GGT ACC 
pro glu glu val pro arg phe val asp phe OCH lys ile cys val thr lys arg gly thr 
61/21 91/31 

AAG GCA TAA AAC CTA GTA CCT GGG GCG GCG GAT TCA ACG AAA ACC GAG TGG GGG TAG TCA 
lys ala OCH asn leu val pro gly ala ala asp ser thr lys thr glu trp gly AMB ser 
121/41 . 151/51 

GGG GCG TGC ATT CCG ACG ACC CTG TAC GAC CCG CTG GTG GCA ACG CCG ATG AGT GCG CCG 
gly ala cys ile pro thr thr leu tyr asp pro leu val ala thr pro met ser ala pro 
181/61 211/71 

ACG AAG GCC GAG CGA CGG GCT GCC GGC GCT GAC CGC CGC GGA AGC CGC CGA GTG CAT GGT 
thr lys ala glu arg arg ala ala gly ala asp arg arg gly ser arg arg val asp alv 
241/81 271/91 

CAC CAC CGC CCG CAC CCG ACC GGT ACG GAT CGC GCC TCG GGT TAC CGT CGC CGT CAA CGC 
his his arg pro his pro thr gly thr asp arg ala ser gly tyr arg arg arq qln ara 
301/101 331/111 y y 

GCT GGA CAG CAT CGG TCC CCG CTG GGT CAA TGC ACT CAT GCA GCG CCG CAA CGA ACA GCT 
ala gly gin his arg ser pro leu gly gin cys thr his ala ala pro gin arg thr ala 
361/121 391/131 

CAA CCC TTG AAC CGG GTC CCG GCC TGC CGA CCC TCG GCC GCC GGC GTG CCG CTA CGT GAT 
gin pro leu asn arg val pro ala cys arg pro ser ala ala gly val pro leu arg asp 
421/141 451/151 

AGA CAC AGG GCC ATG GAA ATC CTG GCC AGC CGG ATG CTA CTT CGG CCG GCG GAC TAT CAG 
arg his arg ala met glu ile leu ala ser arg met leu leu arg pro ala asp tvr aln 
481/161 

CGG TCG CTG AGC TTC TAC CGT GAC CAG ATC 
arg ser leu ser phe tyr arg asp gin ile 

SEQ ID N° 11A 



FIGURE 11A 



CCG AAG 


AGG 


TCC 


CCC 


pro lys 


arg 


ser 


pro 


62/21 








AGG CAT 


AAA 


ACC 


TAG 


arg his 


lys 


thr 


AMB 


122/41 








GGG CGT 


GCA 


TTC 


CGA 


gly arg 


ala 


phe 


arg 


182/61 








CGA AGG 


ccG 


AGC 


GAC 


arg arg 


pro 


ser 


asp 


242/81 








ACC ACC 


GCC 


CGC 


ACC 


thr thr 


ala 


arg 


thr 


302/101 






CTG GAC 


AGC 


ATC 


GGT 


leu asp 


ser 


ile 


gly 


362/121 








AAC CCT 


TGA 


ACC 


GGG 


asn pro 


OPA 


thr 


gly 


422/141 








GAC ACA 


GGG 


CCA 


TGG 


asp thr 


gly 


pro 


trp 


482/161 








GGT CGC 


TGA 


GCT 


TCT 


gly arg 


OPA 


ala 


ser 



GTT TTG TTA ATT TTT 
val leu leu ile phe 

TAC CTG GGG CGG CGG 
tyr leu gly arg arg 

CGA CCC TGT ACG ACC 
arg pro cys thr thr 

GGG CTG CCG GCG CTG 
gly leu pro ala leu 

CGA CCG GTA CGG ATC 
arg pro val arg ile 

CCC CGC TGG GTC AAT 
pro arg trp val asn 

TCC CGG CCT GCC GAC 
ser arg pro ala asp 

AAA TCC TGG CCA GCC 
lys ser trp pro ala 

ACC GTG ACC AGA TC 
thr val thr arg 



32/11 








AAA AAA 


TTT 


GTG 


TCA 


lys lys 


phe 


val 


ser 


92/31 








ATT CAA 


CGA 


AAA 


CCG 


ile gin 


arg 


lys 


pro 


152/51 








CGC TGG 


TGG 


CAA 


CGC 


arg trp 


trp 


gin 


arg 


212/71 








ACC GCC 


GCG 


GAA 


GCC 


thr ala 


ala 


glu 


ala 


272/91 






GCG CCT 


CGG 


GTT 


ACC 


ala pro 


arg 


val 


thr 


332/111 








GCA CTC 


ATG 


CAG 


CGC 


ala leu 


met 


gin 


arg 


392/131 








CCT CGG 


CCG 


CCG 


GCG 


pro arg 


pro 


pro 


ala 


452/151 








GGA TGC 


TAC 


TTC 


GCC 


gly cys 


tyr 


phe 


gly 



CAA 
gin 


AGC GGG 
ser gly 


GTA 
val 


CCA 
pro 


AGT 
ser 


GGG GGT 
gly gly 


AGT 
ser 


CAG 
gin 


CGA TGA GTG 
arg OPA val 


CCC 
arg 


CGA 
arg 


GCC GAG TGG 
ala glu trp 


ATG 
met 


GTC 
val 


GTC 
val 


GCC GTC 
ala val 


ACC 
asn 


GCG 
ala 


CGC 
arg 


AAC GAA 
asn glu 


CAG 
gin 


CTC 
leu 


TGC 
cys 


CGC TAC 
arg tyr 


GTG 
val 


ATA 
ile 


CGG CGG ACT 
arg arg thr 


ATC 
ile 


AGC 
ser 



SEQ ID N° 11B 



FIGURE 11B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

33/185 



33/11 
AAA AAT 
lys asn 
93/31 
TTC AAC 
phe asn 
153/51 
GCT GGT 
ala gly 
213/71 
CCG CCG 
pro pro 
273/91 
CGC CTC 
arg leu 
333/111 
CAC TCA 
his ser 
393/131 
CTC GGC 
leu gly 
453/151 



CGA AGA 


GGT 


CCC 


CCG TTT 


TGT 


TAA TTT 


TTA 


arg arg 
63/21 


gly 


pro 


pro phe 


cys 


OCH phe 


leu 


GGC ATA 


AAA 


CCT 


AGT ACC 


TGG 


GGC GGC 


GGA 


gly ile 
123/41 


lys 


pro 


ser thr trp gly gly gly 


GGC GTG 


CAT 


TCC 


GAC GAC 


CCT 


GTA CGA 


CCC 


gly val 
183/61 


his 


ser 


asp asp 


pro 


val arg 


pro 


GAA GGC 


CGA 


GCG 


ACG GGC 


TGC 


CGG CGC 


TGA 


glu gly 
243/81 


arg 


ala 


thr gly cys 


arg arg 


OPA 


CCA CCG 


CCC 


GCA 


CCC GAC 


CGG 


TAC GGA 


TCG 


pro pro 
303/101 


pro 


ala 


pro asp 


arg 


tyr gly 


ser 


TGG ACA 


GCA 


TCG 


GTC CCC 


GCT 


GGG TCA ATG 


trp thr 
363/121 


ala 


ser 


val pro 


ala 


gly ser 


met 


ACC CTT 


GAA 


CCG 


GGT CCC 


GGC 


CTG CCG 


ACC 


thr leu 
423/141 


glu 


pro 


gly pro gly leu pro 


thr 


ACA CAG 


GGC 


CAT 


GGA AAT 


CCT 


GGC CAG 


CCG 


thr gin 
483/161 


gly 


his 


gly asn 


pro gly gin pro 


GTC GCT 


GAG 


CTT 


CTA CCG 


TGA CCA GAT 


C 


val ala 


glu 


leu 


leu pro 


OPA 


pro asp 





AAA GCG 
lys ala 


GGG 
gly 


TAC 
tyr 


CAA 
gin 


GTG GGG 
val gly 


GTA 
val 


GTC 
val 


AGG 
arg 


GAT GAG 
asp glu 


TGC 
cys 


GCC 
ala 


GAC 
asp 


CCG AGT 
pro ser 


GGA 

mm 1 mm 

gly 


TGG 
trp 


TCA 
ser 


TCG CCG 
ser pro 


TCA 
ser 


ACG 
thr 


CGC 
arg 


GCA ACG 
ala thr 


AAC 
asn 


AGC 
ser 


TCA 
ser 


GCC GCT 
ala ala 


ACG 
thr 


TGA 
OPA 


TAG 
AMB 


GGC GGA 

gly gly 


CTA 
leu 


TCA 
ser 


GCG 
ala 



SEQ ID N° 11C 
FIGURE 11C 



1/1 

CGT CGC 
arg arc 
61/21 
CCG CA/ 
pro glr 
121/41 
GTG CCC 
val pre 
181/61 













31/11 
















CGT CAA 


CGC GCT GGA 


CAG 


CAT 


CGG 


TCC CCG 


CTG GGT 


CAA 


TGC 


ACT 


CAT 


GCA 


GCG 


arg gin 


arg ala gly 


gin 


his 


arg 


ser pro 


leu gly gin 


cys 


thr 


his 


ala 


ala 












91/31 












CGA ACA 


GCT CAA CCC 


TTG 


AAC 


CGG 


GTC CCG 


GCC TGC 


CGA 


CCC 


TCG 


GCC 


GCC 


GGC 


arg thr 


ala gin pro 


leu 


asn 


arg 


val pro 


ala cys 


arg 


pro 


ser 


ala 


ala 


gly 












151/51 














CTA CGT 


GAT AGA CAC 


AGG 


GCC 


ATG 


GAA ATC 


CTG GCC 


AGC 


CGG ATG 


CTA 


CTT 


CGG 


leu arg 


asp arg his 


arg 


ala 


met 


glu ile 


leu ala 


ser 


arg 


met 


leu 


leu 


arg 












211/71 












GAC TAT 


CAG CGG TCG 


CTG 


AGC 


TTC 


TAC CGT 


GAC CAG 


ATC 












asp tyr 


gin arg ser 


leu 


ser 


phe 


tyr arg 


asp glr. 


ile 













SEQ ID N° 11A' 
FIGURE 11A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



34/185 



1/1 31/11 

GTC GCC GTC AAC GCG CTG GAC AGC ATC GGT CCC CGC TGG GTC AAT GCA CTC ATG CAG CGC 
val ala val asn ala leu asp ser ile gly pro arg trp val asn ala leu met gin arg 
61/21 91/31 

CGC AAC GAA CAG CTC AAC CCT TGA ACC GGG TCC CGG CCT GCC GAC CCT CGG CCG CCG GCG 
arg asn glu gin leu asn pro OPA thr gly ser arg pro ala asp pro arg pro pro ala 
121/41 151/51 

TGC CGC TAC GTG ATA GAC ACA GGG CCA TGG AAA TCC TGG CCA GCC GGA TGC TAC TTC GGC 

cys arg tyr val ile asp thr gly pro trp lys ser trp pro ala gly cys tyr phe gly 

181/61 211/71 

CGG CGG ACT ATC AGC GGT CGC TGA GCT TCT ACC GTG ACC AGA TC 

arg arg thr ile ser gly arg OPA ala ser thr val thr arg 



SEQ ID N° 11B' 
FIGURE 11B' 



1/1 31/11 

TCG CCG TCA ACG CGC TGG ACA GCA TCG GTC CCC GCT GGG TCA ATG CAC TCA TGC AGC GCC 
ser pro ser thr arg trp thr ala ser val pro ala gly ser met his ser cys ser ala 
61/21 91/31 

GCA ACG AAC AGC TCA ACC CTT GAA CCG GGT CCC GGC CTG CCG ACC CTC GGC CGC CGG CGT 
ala thr asn ser ser thr leu glu pro gly pro gly leu pro thr leu gly arg arg arq 
121/41 151/51 

GCC GCT ACG TGA TAG ACA CAG GGC CAT GGA AAT CCT GGC CAG CCG GAT GCT ACT TCG GCC 

ala ala thr OPA AMB thr gin gly his gly asn pro gly gin pro asp ala thr ser ala 

181/61 211/71 

GGC GGA CTA TCA GCG GTC GCT GAG CTT CTA CCG TGA CCA GAT C 

gly gly leu ser ala val ala glu leu leu pro OPA pro asp 



SEQ ID N° 11C 
FIGURE 11C 1 

sequence Rv0546c predite par par Cole et al. (Nature 393:537-544) et contenant SeqllA' 



1/1 


















31/11 


















atg gaa 
Met glu 
61/21 


ate 
ile 


ctg 
leu 


gcc 
ala 


age 
ser 


egg 
arg 


atg 
net 


eta 
leu 


Ctt 

leu 


egg ccg 
arg pro 
91/31 


gcg 
ala 


gac 
asp 


tat 
tyr 


cag 
gin 


egg 
arg 


teg 
ser 


ctg 
leu 


age 
ser 


ttc tac 
phe tyr 
121/41 


cgt 
arg 


gac 
asp 


cag 
gin 


ate 
ile 


ggg 

gly 


ctg 
leu 


gcg 
ala 


att 
ile 


gcc cgt 
ala arg 
151/51 


gaa 
glu 


tac 
tyr 


ggg 

gly 


gcc 
ala 


ggc 
gly 


aca 
thr 


gtg 
val 


ttt 
phe 


ttc gcc 
phe ala 
181/61 


ggt 
gly 


cag 
gin 


tea 
ser 


ctg 
leu 


etc 
leu 


gaa 
glu 


ctg 
leu 


gcc 
ala 


ggt tac 
gly tyr 
211/71 


ggc 
gly 


gag 
glu 


ccg 
pro 


gac 
asp 


cat 
his 


teg 
ser 


egg 
arg 


gga 
gly 


cct ttt 
pro phe 
241/81 


CCC 

pro 


ggc 
gly 


gcg 
ala 


ctg 
leu 


tgg 
trp 


ctg 
leu 


cag 
gin 


gtg 
val 


cgc gac 
arg asp 
271/91 


etc 
leu 


gag 
glu 


get 
ala 


acc 
thr 


cag 
gin 


acc 
thr 


gag 
glu 


ctg 
leu 


gtc age 
val ser 
301/101 


cga 
arg 


ggc 
gly 


gtg 
val 


teg 
ser 


ate 
ile 


get 
ala 


cgc 
arg 


gag 
glu 


ccc cgc 
pro arg 
331/111 


cgc 
arg 


gaa 
glu 


ccg 
pro 


tgg 
trp 


ggc 
gly 


ctg 
leu 


cac 
his 


gag 
glu 


atg cat 
met his 
361/121 


gtg 
val 


acc 
thr 


gac 
asp 


cca 
pro 


gac 
asp 


ggg 
giy 


ate 
ile 


aca 
thr 


ctg ata 
leu ile 


ttc 
phe 


gtc 
val 


gag 
glu 


gtt 
val 


ccc 
pro 


gag 
glu 


ggt 
gly 


cac 
his 


ccg ctg 
pro leu 


cgt 
arg 


aca 
thr 


gac 
asp 


acc 
thr 


egg 
arg 


gcg 
ala 


tga 
OPA 























SEQ ID N° 11D 



FEUILLE DE REM@tg&Qgg9EtfJo(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



35/185 



ORF predite par par Cole et al. (Nature 393:537-544) et contenant Rv0546c 
1/1 31/11 



tag tea 
AMB ser 
61/21 


37 ^7 

gly 


cat 
arg 


gca ttc 
ala phe 


aac aac act 
asp asp ala 


gta 
val 


leu pro 
91/31 


get ggt. ggc 
ala gly gly 


aac 
asn 


tec 
ser 


gat 
asp 


gat 
asp 


tgc 
cys 


gcc gac 
ala asp 
121/41 


caa 
glu 


aac 
y y ** 

gly 


eta caa 

V»yU 

leu arg 


Cffff nrt" nrr 

arg ala ala 


ggc 
gly 


gcc gac 
ala asp 
151/51 


cgc cgc gga 
arg arg gly 


age 
ser 


cgc 
arg 


cga 
arg 


gtg 
val 


gat 
asp 


ggt cac 
gly his 
181/61 


cac 
arg 


cac 
arg 


ceo cac 
pro his 


cca acc rrfrt" 

av«^ uuu 

pro thr gly 


gcg 

ala 


yot UyC 

asp arg 
211/71 


gcc 
ala 


teg 
ser 


ggt 
gly 


tgc 
cys 


cgt 
arg 


cgc 
arg 


cgt 
arg 


caa 
gin 


cac act 
arg ala 
241/81 


aaa 
gly 


caa 
gin 


cat egg 
his arg 


tec cca eta 
ser pro leu 


gly 


caa tgc 
gin cys 
271/91 


act 
thr 


cat 
his 


gca 
ala 


gcg 
ala 


ccg 
pro 


caa 
gin 


cga 
arg 


aca 
thr 


get caa 
ala gin 
301/101 


ccc 
pro 


ttq 
leu 


aac caa 
asn arg 


ate cca acc 
val pro ala 


tgc 
cys 


cna err* 

arg pro 
331/111 


teg 
ser 


gcc 
ala 


gcc 
ala 


ggc 
gly 


gtg 
val 


ccg 
pro 


eta 
leu 


cgt 
arg 


gat aga 
asp arg 
361/121 


cac 
his 


aaa 
arg 


acc ata 
ala met 


gaa ate ctg 
glu ile leu 


gcc 
ala 


a rrr* r-nrt 
ay L.y y 

ser arg 
391/131 


atg 
met 


eta 
leu 


ctt 
leu 


egg 
arg 


ccg 
pro 


gcg 
ala 


gac 
asp 


tat 
tyr 


caa caa 
gin arg 
421/141 


tea 
ser 


eta 
leu 


age ttc 
ser phe 


tac cat aac 
tyr arg asp 


cag 
gin 


a t«i» y y y 
ile gly 
451/151 


ctg 
leu 


gcg 
ala 


att 
ile 


gcc 
ala 


cgt 
arg 


gaa 
glu 


tac 
tyr 


ggg 

gly 


gcc ggc 
ala gly 
481/161 


aca 
thr 


gtg 
val 


ttt ttc 
phe phe 


gcc ggt cag 
ala gly gin 


tea 
ser 


ctg etc 
leu leu 
511/171 


gaa ctg gcc 
glu leu ala 


ggt 
gly 


tac 
tyr 


ggc 

gly 


gag 
glu 


ccg 
pro 


gac cat 
asp his 
541/181 


teg 
ser 


egg 
arg 


gga cct 
gly pro 


ttt ccc ggc 
phe pro gly 


gcg 
ala 


ctg tgg 
leu trp 
571/191 


ctg cag gtg 
leu gin val 


cgc 
arg 


gac 
asp 


etc 
leu 


gag 
glu 


get 
ala 


acc cag 
thr gin 
601/201 


acq 
thr 


gag 
<jlu 


ctg gtc 
leu val 


age cga ggc 
ser arg gly 


gtg 
val 


teg ate 
ser ile 
631/211 


get 
ala 


cgc 
arg 


gag 
glu 


ccc 
pro 


cgc 
arg 


cgc 
arg 


gaa 
glu 


ccg 
pro 


tgg ggc 
trp gly 
661/221 


ctg 
leu 


cac 
his 


gag atg 
glu met 


cat gtg acc 
his val thr 


gac 
asp 


cca gac 
pro asp 
691/231 


ggg ate 
gly ile 


aca 
thr 


ctg 
leu 


ata 
ile 


ttc 
phe 


gtc 
val 


gag 
glu 


gtt ccc 
val pro 


gag 
glu 


ggt 
gly 


cac ccg 
his pro 


ctg cgt aca 
leu arg thr 


gac 
asp 


acc egg 
thr arg 


gcg 
ala 


tga 
OPA 















SEQ ID N° 11F 
FIGURE 11F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



36/185 



1/1 

gac cga agg gat 
asp arg arg asp 
61/21 

gac gta gac agg 
asp val asp arg 
121/41 

gag tct ttc cga 
glu ser phe arg 
181/61 

gcg gcc egg gcc 
ala ala arg ala 
241/81 

gac aac cgc gcg 
asp asn arg ala 
301/101 

aac etc egg agt 
asn leu arg ser 



ttc gcg act aac 
phe ala thr asn 

aag aga cag gga 
lys arg gin gly 

gtt cag caa caa 
val gin gin gin 

get teg ggc cga 
ala ser gly arg 

gaa ttc aat egg 
glu phe asn arg 

gat c 
asp 







OX/ J. 1 


tea 


acc 


L.y L, day 


ser 


ala 


r*\r*3 1 i;c 






91/31 


age 


tga 


tga cgt 


ser 


OPA 


OPA arg 






151/51 


teg 


aca 


cag aag 


ser 


thr 


gin lys 






211/71 


gtg 


tct 


gag taa 


val 


ser 


glu OCH 






271/91 


atg 


gcg 


ggc ggg 


met 


ala 


gly gly 



gca acg cga ggt 
ala thr arg gly 

cgc gta ccg gac 
arg val pro asp 

egg gga cca gac 
arg gly pro asp 

gac cag agt cac 
asp gin ser his 

ace gga ttg cgc 
thr gly leu arg 



ctt 
leu 


cat 
his 


gcc gag 
ala glu 


cgc 
arg 


cat 
his 


tct 
ser 


gtc 
val 


egg 
arg 


gag 
glu 


gac 
asp 


gac 
asp 


ggg 

gly 


tec 
ser 


gtg 
val 


tgt 
cys 


egg 
arg 


tea 
ser 


ccg 
pro 


agg 
arg 



SEQ ID N° 12A 



FIGURE 12A 



1/1 

ace gaa ggg att teg 
thr glu gly ile ser 
61/21 

acg tag aca gga aga 
thr AMB thr gly arg 
121/41 

agt ctt tec gag ttc, 
ser leu ser glu phe 
181/61 

egg ccc ggg ccg ctt 
arg pro gly pro leu 
241/81 

aca ace gcg egg aat 
thr thr ala arg asn 
301/101 

acc tec gga gtg ate 
thr ser gly val ile 



cga eta act egg cct 
arg leu thr arg pro 

gac agg gaa get gat 
asp arg glu ala asp 

age aac aat cga cac 
ser asn asn arg his 

egg gcc gag tgt ctg 
arg ala glu cys leu 

tea ate gga tgg egg 
ser ile gly trp arg 



31/11 








gta agg 


caa 


cgc 


gag 


val arg 


gin 


arg 


glu 


91/31 








gac gtc 


gcg 


tac 


egg 


asp val 


ala 


tyr 


arg 


151/51 








aga age 


ggg 


gac 


cag 


arg ser 


gly 


asp gin 


211/71 








agt aag 


acc 


aga 


gtc 


ser lys 


thr 


arg 


val 


271/91 








gcg gga 


ccg 


gat 


tgc 


ala gly 


pro 


asp 


cys 



gtc ttc atg ccg agg 
val phe met pro arg 

acc gcc att ctg teg 
thr ala ile leu ser 

acc ggg agg acg acg 
thr gly arg thr thr 

acg ggt ccg tgt gtg 
thr gly pro cys val 

gcc ggt cac cga gga 
ala gly his arg gly 



SEQ ID N° 12B 



FIGURE 12B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



37/185 

1/1 31/11 

ccg aag gga ttt cgc gac taa etc ggc ctg taa ggc aac gcg agg tct tea tgc cga gga 

pro lys gly phe arg asp OCH leu gly leu OCH gly asn ala arg ser ser cys arg gly 
61/21 91/31 

cgt aga cag gaa gag aca ggg aag ctg atg acg teg cgt ace gga ccg cca ttc tgt cga 

arg arg gin glu glu thr gly lys leu met thr ser arg thr gly pro pro phe cys arg 
121/41 151/51 

gtc ttt ccg agt tea gca aca ate gac aca gaa gcg ggg acc aga ccg gga gga cga cgc 

val phe pro ser ser ala thr ile asp thr glu ala gly thr arg pro gly gly ara ara 
181/61 211/71 

ggc ccg ggc cgc ttc ggg ccg agt gtc tga gta aga cca gag tea egg gtc cgt gtg tga 

gly pro gly arg phe gly pro ser val OPA val arg pro glu ser arg val arg val OPA 
241/81 271/91 

caa ccg cgc gga att caa teg gat ggc ggg egg gac egg att gcg ccg gtc acc gag gaa 

gin pro arg gly ile gin ser asp gly gly arg asp arg ile ala pro val thr glu glu 
301/101 

cct ccg gag tga tc 
pro pro glu OPA 

SEQ ID N° 12C 
FIGURE 12C 



1/1 

GGG ATT TCG TTG CCC GAT GGA TTG TTT GTA 
gly ile ser leu pro asp gly leu phe val 
61/21 

TAT TGG CAA TGC TGG AAA TGG ACA TTC CAA 
tyr trp gin cys trp lys trp thr phe gin 
121/41 

GGG GGG CAA GCG TTT GTA CCG GGG CCA GCA 
gly gly gin ala phe val pro gly pro ala 
181/61 

ATG TTG TTG TGT CAG CGC GGG CTT GGT CTC 
met leu leu cys gin arg gly leu gly leu 
241/81 

TCA AAA CAG GTT GAA CTT AAC GAC TCA AGA 
ser lys gin val glu leu asn asp ser arg 
301/101 

GGA CAC CAA TTT GAC TCG GCT CTT TGG CAA 
gly his gin phe asp ser ala leu trp gin 
361/121 

CGC ATC GTT GGC CTT GCC ATC AAT CGC CGG 
arg ile val gly leu ala ile asn arg arg 
421/141 

GGG ACC GAC CTC GAC CAG GGG TCC TTT GTG 
gly thr asp leu asp gin gly ser phe val 
481/161 

GTC GGT CAT CGC CTA AGG CTA CCG TTC TGA 
val gly his arg leu arg leu pro phe OPA 
541/181 

GGC ACG TCA TGT CTC AGC GGC CCA CCG CCA 
gly thr ser cys leu ser gly pro pro pro 
601/201 

CAG ATG ACT CCA CGC AGC CTT GTT CGC ATC 
gin met thr pro arg ser leu val arg ile 
661/221 

CTG GTG AGC GCA CCC GCC GGC GGT CGT GCC 
leu val ser ala pro ala gly gly arg ala 



OX/ ± 1 














CGG TTT 


GGG 


AAA 


AAC 


ACT TGA AGT 


CCT 


TTT 


arg phe 


gly 


lys 


asn 


thr OPA ser 


pro 


phe 


91/31 










TAT TGC 


GCG 


AAT 


TAA 


CCG AAC ACG 


GTG 


AGG 


tyr cys 


ala 


asn 


OCH 


pro asn thr 


val 


arg 


151/51 












AGC GCC 


GCC 


GAC 


CGG 


TTG ACC GAA 


GCC 


AGC 


ser ala 


ala 


asp 


arg 


leu thr glu 


ala 


ser 


211/71 














GAT GTC 


CCG 


GCC 


TTG 


GCT GGA CCC 


GCT 


TCT 


asp val 


pro 


ala 


leu ala gly pro 


ala 


ser 


271/91 














ACG GAA 


ACG 


CTT 


GAA 


CCG CGA CGT 


CGC 


TCC 


thr glu 


thr 


leu 


glu pro arg arg 


arg 


ser 


331/111 












TTG AAG 


GTG 


AGC 


TGC 


GAG CAG CCG 


GGT 


GAC 


leu lys 


val 


ser 


cys glu gin pro 


gly 


asp 


391/131 












CTC GCG 


GAC 


GTA 


GAT 


AAT CAG CTC 


ACC 


GTT 


leu ala 


asp 


val 


asp asn gin leu 


thr 


val 


451/151 














ACT GCC 


GGG 


CTT 


GAC 


GCG GAC GAC 


CAC 


AGA 


thr ala 


gly 


leu 


asp 


ala asp asp 


his 


arg 


511/171 












CCT GGG 


GCT 


GCG 


TGG 


GCG CCG ACG 


ACG 


TGA 


pro gly 


ala 


ala 


trp 


ala pro thr 


thr 


OPA 


571/191 














CCT CGG 


TCG 


CCG 


GCA 


GTA TGT CAG 


CAT 


GTG 


pro arg 


ser 


pro 


ala 


val cys gin 


his 


val 


631/211 












GTT GGT 


GTC 


GTG 


GTT 


GCG ACG ACC 


TTG 


GCG 


val gly 


val 


val 


val 


ala thr thr 


leu 


ala 


691/231 














GCG CAT 


GCG 


GAT 


C 








ala his 


ala 


asp 











SEQ ID N° 13A 



FIGURE 13A 
FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



38/185 





















32/11 


















GGA TTT 


CGT 


TGC 


CCG 


ATG 


GAT 


TGT 


TTG 


TAC 


GGT TTG 


GGA AAA ACA 


CTT 


GAA 


GTC 


CTT 


TTT 


alv ohe 


arg 


cys 


pro 


met 


asp 


cys 


leu 


tvr 


gly leu gly lys thr 


leu glu 


val 


leu 


phe 


62/21 


































ATT GGC 


AAT 


GCT 


GGA 


AAT 


GGA 


CAT 


TCC 


AAT 


att rrr 


CGA ATT AAC 


CGA ACA 




TGA 


GGG 


ile alv 


asn 


ala 


alv 


asn 


alv 
yj.y 


his 


ser 


a qn 


ne ala 


arg 


lie 


asn 


arg 


thr 


arg 


OPA 


gly 


122/41 






























GGG GGC 


AAG 


CGT 


TTG 


TAC 


CGG 


GGC 


CAG 


CAA 


CjUCj CCG 


CCv? 


ACC 


GGT 


TGA 


CCG 


AAG 


CCA 


GCA 


alv alv 


1 vs 

J: 


arg 


leu 


tvr 


arg 


yxy 


gin 


y -i.il 


ala pro 


pro 


thr 


gly 


OPA 


pro 


lys 


pro 


ala 


182/61 


















^ / J. 










TGT TGT 


TGT 


GTC 


AGC 


GCG 


GGC 


TTG 


GTC 


TCG 


ATG TCC 


CGG 


CCT 


TGG 


CTG 


GAC 


CCG 


CTT 


CTT 


cys cys 


cys 


val 


ser 


ala 


al v 

yj-y 


leu 




cor* 
act 


met ser 


arg 


pro 


trp 


1 All 

JLeu 


asp 


pro 


leu 


leu 


242/81 


















272/91 














CAA AAC 


AGG 


TTG 


AAC 


TTA 


ACG 


ACT 






CGG AAA 


CGC 


TTG 


AAC 


CGC 


GAC 


GTC 


GCT 


CCG 


y JL 1 1 aDll 


arg 


1 

IvU 


on 
aoll 


1CU 


rhr 

1.11 1. 


rhr 


gin 


glu 


arg lys 


arg 


leu 


asn 


arg 


asp 


val 


ala 


pro 


302/101 


















332/111 












GAC ACC 


AAT 


TTG 


ACT 


CGG 


CTC 


TTT 


GGC 


AAT 


TGA AGG 


TGA 


GCT 


GCG 


AGC 


AGC 


CGG 


GTG 


ACC 




asn 


leu 


thr 


o i. y 




£J11C 


gly 


asn 


OPA arg 


OPA 


ala 


ala 


ser 


ser 


arg 


val 


thr 


362/121 


















392/131 














GCA TCG 


TTG 


GCC 


TTG 


CCA 


TCA 


ATC 


GCC 


GGC 


TCG CGG 


ACG 


TAG 


ATA 


ATC 


AGC 


TCA 


CCG 


TTG 


sis ser 


leu 


ala 


leu 


pro 


ear 




dl cl 


gly 


ser arg 


thr 


AMB 


ile 


ile 


ser 


ser 


pro 


leu 


422/141 


















452/151 
















GGA CCG 


ACC 


TCG 


ACC 


AGG 


GGT 


CCT 


TTG 


TGA 


CTG CCG 


GGC 


TTG 


ACG 


CGG 


ACG 


ACC 


ACA 


GAG 


alv nro 


thr 




thr 


ct x.y 


gxy 


pro 


1 #»» 
xcu 




leu pro gly leu thr 


arg 


thr 


thr 


thr 


glu 


482/161 


















512/171 














TCG GTC 


ATC 


GCC 


TAA 


GGC 


TAC 


CGT 


TCT 


GAC 


CTG GGG 


CTG 


CGT 


GGG 


CGC 


CGA 


ecu. 




pap 


ser val 


ile 


ala 


OCH 


gly 


tyr 


arg 


ser 


asp 


leu gly leu arg gly 


arg 


arg 


arg 


arg 


glu 


542/181 


















572/191 










GCA CGT 


CAT 


GTC 


TCA 


GCG 


GCC 


CAC 


CGC 


CAC 


CTC GGT 


CGC 


CGG 


CAG 


TAT 


GTC 


AGC 


ATG 


TGC 


ala arg 


his 


val 


ser 


ala 


ala 


his 


arg 


his 


leu gly arg arg gin 


tyr val 


ser 


met 


cys 


602/201 


















632/211 
















AGA TGA 


CTC 


CAC 


GCA 


GCC 


TTG 


TTC 


GCA 


TCG 


TTG GTG 


TCG 


TGG 


TTG 


CGA 


CGA 


CCT 


TGG 


CGC 


arg OPA 


leu 


his 


ala 


ala 


leu 


phe 


ala 


ser 


leu val 


ser 


trp 


leu 


arg 


arg 


pro 


trp 


arg 


662/221 


















692/231 








TGG TGA 


GCG 


CAC 


CCG 


CCG 


GCG 


GTC 


GTG 


CCG 


CGC ATG 


CGG 


ATC 














trp OPA 


ala 


his 


pro 


pro 


ala 


val 


val 


pro 


arg met 


arg 


ile 















SEQ ID N° 13B 
FIGURE 13B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



39/185 



33/11 

GAT TTC GTT GCC CGA TGG ATT GTT TGT ACG GTT TGG GAA AAA CAC TTG AAG TCC TTT TTA 

asp phe val ala arg trp ile val cys thr val trp glu lys his leu lys ser phe leu 
63/21 93/31 

TTG GCA ATG CTG GAA ATG GAC ATT CCA ATA TTG CGC GAA TTA ACC GAA CAC GGT GAG GGG 

leu ala met leu glu met asp ile pro ile leu arg glu leu thr glu his qlv qlu alv 

123/41 153/51 * * * y y 

GGG GCA AGC GTT TGT ACC GGG GCC AGC AAG CGC CGC CGA CCG GTT GAC CGA AGC CAG CAT 

gly ala ser val cys thr gly ala ser lys arg arg arg pro val asp arg ser gin his 
183/61 213/71 

GTT GTT GTG TCA GCG CGG GCT TGG TCT CGA TGT CCC GGC CTT GGC TGG ACC CGC TTC TTC 

val val val ser ala arg ala trp ser arg cys pro gly leu gly trp thr arg phe phe 
243/81 273/91 

AAA ACA GGT TGA ACT TAA CGA CTC AAG AAC GGA AAC GCT TGA ACC GCG ACG TCG CTC CGG 

lys thr gly OPA thr OCH arg leu lys asn gly asn ala OPA thr ala thr ser leu ara 

303/101 333/111 9 

ACA CCA ATT TGA CTC GGC TCT TTG GCA ATT GAA GGT GAG CTG CGA GCA GCC GGG TGA CCG 

thr pro ile OPA leu gly ser leu ala ile glu gly glu leu arg ala ala gly OPA pro 
363/121 393/131 

CAT CGT TGG CCT TGC CAT CAA TCG CCG GCT CGC GGA CGT AGA TAA TCA GCT CAC CGT TGG 

his arg trp pro cys his gin ser pro ala arg gly arg arg OCH ser ala his arq trp 
423/141 453/151 

GAC CGA CCT CGA CCA GGG GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT 

asp arg pro arg pro gly val leu cys asp cys arg ala OPA arg gly arg pro gin ser 
483/161 513/171 

CGG TCA TCG CCT AAG GCT ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG 

arg ser ser pro lys ala thr val leu thr trp gly cys val gly ala asp asp val arq 
543/181 . 573/191 

CAC GTC ATG TCT CAG CGG CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA 

his val met ser gin arg pro thr ala thr ser val ala gly ser met ser ala cys ala 
603/201 633/211 

GAT GAC TCC ACG CAG CCT TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT 

asp asp ser thr gin pro cys ser his arg trp cys arg gly cys asp asp leu gly ala 

663/221 693/231 

GGT GAG CGC ACC CGC CGG CGG TCG TGC CGC GCA TGC GGA TC 

gly glu arg thr arg arg arg ser cys arg ala cys gly 



SEQ ID N° 13C 
FIGURE 13C 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



40/185 

partie de la sequence nucleotidique de 3eql3A 
1/1 ^ 31/11 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA GTC GGT CAT CGC CTA AGG 
gly 3er phe val thr ala gly leu asp ala asp asp his arg val gly his arq leu ara 
61/21 91/31 . 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA GGC ACG TCA TGT CTC AGC 
leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA gly thr ser cys leu ser 
121/41 151/51 

GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG CAG ATG ACT CCA CGC AGC 
gly pro pro pro pro arg ser pro ala val cys gin his val gin met thr pro ara ser 
181/61 211/71 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG CTG GTG AGC GCA CCC GCC 
leu val arg ile val gly val val val ala thr thr leu ala leu val ser ala pro ala 
241/81 

GGC GGT CGT GCC GCG CAT GCG GAT C 
gly gly, arg ala ala his ala asp 



SEQ ID N° 13A' 
FIGURE 13A' 



1/1 31/11 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG TCG GTC ATC GCC TAA GGC 
gly pro leu OPA leu pro gly leu thr arg thr thr thr glu ser val ile ala OCH olv 
61/21 91/31 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 
tyr arg ser asp leu gly leu arg gly arg arg arg arg glu ala arg his val ser ala 
121/41 151/51 

GCC CAC CGC CAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC AGA TGA CTC CAC GCA GCC 
ala his arg his leu gly arg arg gin tyr val ser met cys arg OPA leu his ala ala 
181/61 211/71 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC TGG TGA GCG CAC CCG CCG 
leu phe ala ser leu val ser trp leu arg arg pro trp arg trp OPA ala his pro pro 
241/81 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg ile 



SEQ ID N° 13B' 
FIGURE 13B» 



1/1 31/11 

GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT CGG TCA TCG CCT AAG GCT 
val leu cys asp cys arg ala OPA arg gly arg pro gin ser arg ser ser pro lys ala 
61/21 91/ 31 

ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG CAC GTC ATG TCT CAG CGG 
thr val leu thr trp gly cys val gly ala asp asp val arg his val met ser gin ara 
121/41 151/51 

CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA GAT GAC TCC ACG CAG CCT 
pro thr ala thr ser val ala gly ser met ser ala cys ala asp asp ser thr gin pro 
181/61 211/71 

TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT GGT GAG CGC ACC CGC CGG 
cys ser his arg trp cys arg gly cys asp asp leu gly ala gly glu arg thr arg arg 
241/81 

CGG TCG TGC CGC GCA TGC GGA TC 
arg ser cys arg ala cys gly 



SEQ ID N° 13C 
FIGURE 13C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



41/185 



sequence Rvl984c pr^dite par Cole et al . (Nature 393:537-544) et contenant 



seql3A' 
1/1 


















31/11 


















atg act 
Met thr 
61/21 


cca 
pro 


cgc 
ara 


age 
ser 


ctt 
leu 


gtt 
val 


cgc 
arg 


ate 
ile 


gtt 
val 


ggt gtc 

alv val 
yj.y vox 

91/31 


gtg 


gtt 


gcg 

ala 


acg 
tnr 


acc 
thr 


ttg 
leu 


gcg 
ala 


ctg 
leu 


gtg age 
val ser 
121/41 


gca 
ala 


ccc 
Dro 


gee 
ala 


ggc 

al V 


ggt 

yiy 


cgt 
arg 


gee 
ala 


gcg 
ala 


cat gcg 

hi «s al a 
ills ala 

151/51 


gat 
asp 


ccg 
pro 


tgt 
cys 


teg 
ser 


gac 
asp 


ate 
ile 


gcg 
ala 


gtc 
val 


gtt ttc 
val phe 
181/61 


get 
ala 


cgc 
ara 


ggc 

y j.y 


acg 
thr 


cat 
his 


cag 

rrl n 
y xii 


get 

Ct JL cl 


tct 

OCX. 


ggt ctt 

yiy Xcu 

211/71 


ggc 
gly 


gac 
asp 


gtc 
val 


ggt 
gly 


gag 
glu 


gcg 
ala 


ttc 
phe 


gtc 
val 


gac teg 
asp ser 
241/81 


ctt 
leu 


acc 
thr 


teg 
ser 


caa 
aln 


gtt 
val 


ggc 
alv 

y iy 


ggg 

alv 
yxy 


egg 
arg 


teg att 
ser ile 
271/91 


ggg 

gly 


gtc 

Val 


tac 
tyr 


gcg 
ala 


gtg 
val 


aac 
asn 


tac 
tyr 


cca 
pro 


gca age 
ala ser 
301/101 


gac 
asp 


gac 
asD 


tac 
tvr 


cgc 
arg 


gcg 
ala 


age 
ser 


gcg 
ala 


tea 
ser 


aac ggt 
asn gly 
331/111 


tec 
ser 


gat 
asp 


gat 
asp 


gcg 
ala 


age 
ser 


gee 
ala 


cac 
his 


ate 
ile 


cag cgc 
gin arg 
361/121 


acc 
thr 


gtc 
val 


gee 
ala 


age 
ser 


tgc 

CVS 
J 


ccg 
pro 


aac 
asn 


acc 
thr 


agg att 
arg ile 
391/131 


gtg 

val 


ctt 
leu 


ggt 
gly 


ggc 

mm 

gly 


tat 
tyr 


teg 
ser 


cag 
gin 


ggt 
gly 


gcg acg 
ala thr 
421/141 


gtc 
val 


ate 
ile 


gat 
asp 


ttg 
leu 


tee 
ser 


acc 
thr 


teg 
ser 


gcg 
ala 


atg ccg 
met pro 
451/151 


CCC 

pro 


gcg 
ala 


gtg 
val 


aca 
ala 


aat 
asp 


cat 
his 


ate 
val 


acc 
ala 


get gtc 
ala val 
481/161 


gec 
ala 


ctt 
leu 


ttc 
phe 


ggc 
gly 


gag 
glu 


cca 
pro 


tec 
ser 


agt 
ser 


ggt ttc 
gly phe 
511/171 


tec 
ser 


age 
ser 


atg 
met 


ttg 
leu 


tgg 
trp 


ggc 
gly 


ggc 
gly 


ggg 

gly 


teg ttg 
ser leu 
541/181 


ccg 
pro 


aca 
thr 


ate 
ile 


ggt 
gly 


ccg 
pro 


ctg 
leu 


tat 
tyr 


age 
ser 


tct aag 
ser lys 
571/191 


acc 
thr 


ata 
ile 


aac 
asn 


ttg 
leu 


tgt 
cys 


get 
ala 


ccc 
pro 


gac 
asp 


gat cca 
asp pro 
601/201 


ata 
ile 


•tgc 
cys 


acc 
thr 


gga 

giy 


ggc 
gly 


ggc 
gly 


aat 
asn 


att 
ile 


atg gcg 
met ala 
631/211 


cat 
his 


gtt 

val 


teg 
ser 


tat 
tyr 


gtt 
val 


cag 
gin 


teg 
ser 


ggg 

gly 


atg aca 
met thr 


age 
ser 


cag 
gin 


gcg 
ala 


gcg 
ala 


aca 
thr 


ttc 
phe 


gcg 
ala 


gcg 
ala 


aac agg 
asn arg 


etc 
leu 


gat 
asp 


cac 
his 


gee 
ala 


gga 
gly 


tga 
OPA 







SEQ ID N° 13D 
FIGURE 13D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



42/185 



Seql3F: 


ORF 


predite 


1/1 








taa QQC 

****** 33 v * 


aca 


tea 


tgt 


OPA gly 


thr 


ser 


cys 


61/21 








ata caa 


ata 


act 


cca 


val gin 


met 


thr 


pro 


121/41 








aco eta 


ata 


age 


gca 


ala leu 


val 


ser 


ala 


181/61 








aca ate 


att 


ttc 


get 


ala val 


val 


phe 


ala 


241/81 








ttc gtc 


aac 


teg 


ctt 


phe val 


asp 

r 


ser 


leu 


301/101 

•J \J A. / A. \J J. 








tac cca 


aca 


age 


gac 


tyr pro 


ala 


ser 


asp 


361/121 








cac ate 


caa 


cgc 


ace 


his ile 


aln 


arg 


thr 


421/141 








caa aat 


aca 


acg 


gtc 


gin gly 


ala 


thr 


val 


481/161 








gtc gcc 


get 


gtc 


gcc 


val ala 


ala 


val 


ala 


541/181 








ggc ggg 


teg 


ttg 


ccg 


gly gly 


ser 


•leu 


pro 


601/201 








ccc gac 


gat 


cca 


ata 


pro asp 


asp 


pro 


ile 


661/221 








teg ggg 


atg 


aca 


age 


ser gly 


met 


thr 


ser 



par Cole et al. 



etc age ggc cca ccg 
leu ser gly pro pro 

cgc age ctt gtt cgc 
arg ser leu val arg 

ccc gcc ggc ggt cgt 
pro ala gly gly arg 

cgc ggc acg cat cag 
arg gly thr his gin 

acc teg caa gtt ggc 
thr ser gin val gly 

gac tac cgc gcg age 
asp tyr arg ala ser 

gtc gcc age tgc ccg 
val ala ser cys pro 

ate gat ttg tec acc 
ile asp leu ser thr 

ctt ttc ggc gag cca 
leu phe gly glu pro 

aca ate ggt ccg ctg 
thr ile gly pro leu 

tgc acc gga ggc ggc 
cys thr gly gly gly 

cag gcg gcg aca ttc 
gin ala ala thr phe 



393:537-544) et 



31/11 








cca cct 
pio pro 
91/31 


egg 
arg 


teg 
ser 


ccg 
pro 


ate gtt 

{la v a "I 

J.lc Val 

151/51 


ggt 
gly 


gtc 
val 


gtg 
val 


gcc gcg 

ala ala 

211/71 


cat 
nis 


gcg 
ala 


gat 
asp 


get tct 
ala ser 
271/91 


ggt 

gly 


ctt 
leu 


ggc 
gly 


ggg egg 
gly arg 
331/111 


teg 
ser 


att 
lie 


ggg 

gly 


gcg tea 
ala ser 
391/131 


aac 
asn 


ggt 

giy 


tec 
ser 


aac acc 

aen 4- V» ** 

aaii will 

451/151 


agg 
arg 


att 
lie 


gtg 
val 


tea aca 
ser ala 
511/171 


atg 
met 


pro 


ccc 
pro 


tec agt 
ser ser 
571/191 


ggt 
gly 


ttc 
phe 


tec 
ser 


tat age 
tyr ser 
631/211 


tct 
ser 


aag 
lys 


acc 
thr 


aat att 
asn ile 
691/231 


atg 
met 


gcg 
ala 


cat 
his 


gcg gcg 
ala ala 


aac 
asn 


agg 
arg 


etc 
leu 



con tenant Rvl984c 



gca 
ala 


gta 
val 


tgt 
cys 


cag 
gin 


cat 
his 


gtt 
val 


gcg 
ala 


acg 
thr 


acc 
thr 


ttg 
leu 


ccg 
pro 


tgt 
cys 


teg 
ser 


gac 
asp 


ate 
ile 


gac 
asp 


gtc 
val 


ggt 
gly 


gag 
glu 


gcg 
ala 


gtc 
val 


tac 
tyr 


gcg 
ala 


gtg 
val 


aac 
asn 


gat 
asp 


gat 
asp 


gcg 
ala 


age 
ser 


gcc 
ala 


ctt 
leu 


ggt 
gly 


ggc 
gly 


tat 
tyr 


teg 
ser 


gcg 
ala 


gtg 
val 


gca 
ala 


gat 
asp 


cat 
his 


age 
ser 


atg 
met 


ttg 
leu 


tgg 
trp 


ggc 
gly 


ata 
ile 


aac 
asn 


ttg 
leu 


tgt 
cys 


get 
ala 


gtt 
val 


teg 
ser 


tat 
tyr 


gtt 
val 


cag 
gin 


gat 

asp 


cac 
his 


gcc 
ala 


gga 
gly 


tga 
OPA 



SEQ ID N° 13F 
FIGURE 13F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CCA CCG 


GGG 


CTG 


GAG 


GGG 


CGA 


oro Dro 
61/21 


olv 


leu 


alu 


y x Jr 


arg 


GCG GCT 


GAT 


CCC 


CTG 


GCC 


CGA 


ala ala 
121/41 


asD 


Dro 


leu 


ala 


arg 


GTA GCG 


GTT 


CGG 


CGG 


GAA 


CCG 


val ala 
181/61 


val 


arg 


arg 


glu 


pro 


GAC GGG 


TAT 


GGC 


GGC 


GAC 


TGA 


asp gly 

941 / ftl 
Z H X/ OX 


tyr 


gly 


gly 


asp 


OPA 


TTA CGA 


CCA 


GGG 


AAT 


TTC 


GAA 


leu arg 
301/101 


pro 


gly 


asn 


phe 


glu 


ACC CCC 


TAG 


GTG 


TAG 


TGT 


TTT 


thr pro 
C 


AMB 


val 


AMB 


cys 


phe 


CAC CGG 


GGC 


TGG 


AGG 


GGC 


GAA 


his arg 
62/21 


alv 


trt> 


arg 




glu 


CGG CTG 


ATC 


CCC 


TGG 


CCC 


GAG 


arg leu 
122/41 


ile 


pro 


trp 


Dro 


alu 


TAG CGG 


TTC 


GGC 


GGG 


AAC 


CGA 


AMB arg 
182/61 


phe 


gly 


gly 


asn 


arg 


ACG GGT 


ATG 


GCG 


GCG 


ACT 


GAG 


thr gly 
242/81 


met 


ala 


ala 


thr 


glu 


TAC GAC 


CAG 


GGA 


ATT 


TCG 


AAA 


tyr asp 
302/101 


gin 


gly 


ile 


ser 


lys 


CCC CCT 


AGG 


TGT 


AGT 


GTT 


TTC 


pro pro 


arg 


cys 


ser 


val 


phe 



43/185 









31/11 




ATG 


TGC 


GCC 


GAA CGC CGT 


CGG 


met 


CVS 


ala 


glu arg arg 


arg 








91/31 


GAC 


GGG 


GCA 


AGC CAA TAG 


CGG 






ala 


ser gin AMB 


arg 








151/51 


AGC 


GCC 


GAC 


GTT GTC GGT 


GCC 


ser 


ala 


asp 


val val gly ala 








211/71 




GGT 


GAT 


CTG 


CGA CAC GCC 


GCC 


gly 


asp 


leu 


arg his ala 


ala 








271/91 




AAT 


GTT 


ATT 


CAG AAC ATC 


TTG 


asn 


val 


ile 


gin asn ile 


leu 








331/111 




CGA 


GTA 


CCG 


GCA GAT CCC AGT 


arg 


val 


pro 


ala asp pro 


ser 



SEQ ID N° 14A 
FIGURE 14A 









32/11 






TGT 


GCG 


CCG 


AAC GCC 


GTC 


GGC 


cys 


ala 


pro 


asn ala 


val gly 








92/31 






ACG 


GGG 


CAA 


GCC AAT 


AGC 


GGC 


thr 


gly 


gin 


ala asn 


ser 


gly 








152/51 




GCG 


CCG 


ACG 


TTG TCG 


GTG 


CCC 


ala 


pro 


thr 


leu ser 


val 


pro 








212/71 




GTG 


ATC 


TGC 


GAC ACG 


CCG 


CCG 


val 


ile 


cys 


asp thr 


pro 


pro 








272/91 






ATG 


TTA 


TTC 


AGA ACA 


TCT 


TGT 


met 


leu 


phe 


arg thr 


ser 


cys 








332/111 






GAG 


TAC 


CGG 


CAG ATC 


CCA 


GTT 


glu 


tyr 


arg 


gin ile 


pro 


val 



SEQ ID N° 14B 
FIGURE 14B 



CCA ACT 
pro thr 


TGG 
trp 


CCG 
pro 


CTG 
leu 


AGG 
arg 


CTC CAT 
leu his 


CGG 
arg 


GCT 
ala 


TTG 
leu 


CTG 
leu 


CGG TGA TAT 
arg OPA tyr 


ATT 
ile 


GGG 
gly 


TCA 
ser 


GCG GTG 
ala val 


CTC 
leu 


GAG 
glu 


CCA 
pro 


GGC 
gly 


TAT CTC TTC 
tyr leu phe 


CTC 
leu 


CGT 
arg 


GCC 
ala 


TCA CCA GTC 
ser pro val 


TCA 
ser 


CCA 
pro 


GAT 
asp 


CAA CTT GGC 
gin leu gly 


CGC 
arg 


TGA 
OPA 


GGG 
gly 


TCC ATC 
ser ile 


GGG 
gly 


CTT 
leu 


TGC 
cys 


TGG 
trp 


GGT GAT ATA 
gly asp ile 


TTG 
leu 


GGT 
gly 


CAG 
gin 


CGG TGC 
arg cys 


TCG 
ser 


AGC 
ser 


CAG 
gin 


GCT 
ala 


ATC TCT 
ile ser 


TCC 
ser 


TCC 
ser 


GTG 
val 


CCA 
pro 


CAC CAG 
his gin 


TCT 
ser 


CAC 
his 


CAG 
gin 


ATC 
ile 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



ACC GGG 


GCT 


GGA 


GGG 


GCG 


AAT 


thr gly 


ala 




al v 


ala 


asn 


63/21 












GGC TGA 


TCC 


CCT 


GGC 


CCG 


AGA 


gly OPA 


ser 


pro 


yxy 




ci jl y 


123/41 












AGC GGT 


TCG 


GCG 


GGA 


ACC 


GAG 


ser gly 


ser 


ala 


gly 


thr 


glu 


183/61 












CGG GTA 


TGG 


CGG 


CGA 


CTG 


AGG 


arg val 


trp 


arg 


arg 


leu 


arg 


243/81 












ACG ACC 


AGG 


GAA 


TTT 


CGA 


AAA 


thr. thr 


arg 


glu 


phe 


arg 


lys 


303/101 












CCC CTA 


GGT 


GTA 


GTG 


TTT 


TCG 


pro leu 


gly 


val 


val 


phe 


ser 



44/185 









33/11 




GTG 


CGC 


CGA 


ACG CCG 


TCG 


val 


aro 


arg 


thr pro 


ser 








93/31 




CGG 


GGC 


AAG 


CCA ATA GCG 


arg 




lvs 


pro ile 


ala 








153/51 




CGC 


CGA 


CGT 


TGT CGG 


TGC 


arg 


arg 


aro 


cys arg 


cys 








213/71 




TGA 


TCT 


GCG 


ACA CGC 


CGC 


OPA 


ser 


ala 


thr arg 


arg 








273/91 




TGT 


TAT 


TCA 


GAA CAT 


CTT 


cys 


tyr 


ser 


glu his 


leu 








333/111 




AGT 


ACC 


GGC 


AGA TCC 


CAG 


ser 


thr 


gly 


arg ser 


gin 



SEQ ID N° 14C 
FIGURE 14C 



GCC 


AAC 


TTG 


GCC 


GCT 


GAG 


GGC 


ala 


asn 


leu 


ala 


ala 


glu 


gly 


GCT 


CCA 


TCG 


GGC 


TTT 


GCT 


GGT 


ala 


pro ser gly 


phe 


ala 


gly 


CCG 


GTG 


ATA 


TAT 






M.o/\ 


pro 


val 


ile 


tyr 


trp 


val 


arg 


CGC 


GGT 


GCT 


CGA 


GCC 


AGG 


CTT 


ar 9* giy ala 


arg 


ala 


arg 


leu 


GTA 


TCT 


CTT 


CCT 


CCG 


TGC 


CAC 


val 


ser 


leu 


pro 


pro 


cys 


his 


TTC 


ACC 


AGT 


CTC 


ACC 


AGA 


TC 


phe thr 


ser 


leu 


thr 


arg 





partie de la sequence nucleotidicfue de seq!4A 
1/1 31/11 

TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA GAT C 
phe ser ser thr gly arg ser gin val his gin val ser pro asp 

SEQ ID N° 14A' 
FIGURE 14A' 



1/1 31/11 

TGT TTT CGA GTA CCG GCA GAT CCC AGG TTC ACC AGG TCT CAC CAG ATC 
cys phe arg val pro ala asp pro arg phe thr arg ser his gin ile 

SEQ ID N° 14C 
FIGURE 14C 



1/1 31/11 

GTT TTC GAG TAC CGG CAG ATC CCA GGT TCA CCA GGT CTC ACC AGA TC 
val phe glu tyr arg gin ile pro gly ser pro gly leu thr arg 



SEQ ID N° 14C» 



FIGURE 14C 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



45/185 



ORF predite d'apres la sequence publiee par Cole et al. (Nature 393:537-544) et 
contenant seql4A' 

1/1 31/11 

TAG CGG TTC GGC GGG AAG CTA GCG GCG ACG TTG TCG GTG GCC GGT GAT ATA TTG GGT CAG 
AMB arg phe gly gly lys leu ala ala thr leu ser val ala gly asp ile leu qlv aln 
61/21 91/31 * Y 9 

ACG GGT ATG GCG GCG GCT GAG GTG ATC TGC GAC ACG CCG CCG CGG TGC TCG AGC CAG GCT 
thr gly met ala ala ala glu val ile cys asp thr pro pro arg cys ser ser gin ala 
121/41 151/51 

TAC GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA TCT TGT ATC TCT TCT CCG TGC CAC 
tyr asp gin gly ile ser lys met leu phe arg thr ser cys ile ser ser pro cys his 
181/61 211/71 

CCC CTA GGT GTA GTG TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA gat 
pro leu gly val val phe ser ser thr gly arg ser gin val his gin val ser pro aso 
241/81 271/91 

cca egg ggc gcg atg aac ttc ccg gca teg gca teg cca ggt cga egg acg tgg teg cgc 
pro arg gly ala met asn phe pro ala ser ala ser pro gly arg* arg thr trp ser ara 
301/101 331/111 

tat gac ggg aat ctg gag cct tgt egg gee get caa cat ate gaa gat gca eta ctt gag 
tyr asp gly asn leu glu pro cys arg ala ala gin his ile glu asp ala leu leu alu 
361/121 391/131 

teg ttg cca gat cct gtc aga ttc ccg att tec gca aag gag egg tac gee cat gac cgt 
ser leu pro asp pro val arg phe pro ile ser ala lys glu arg tyr ala his asp arg 
421/141 

gac cgt tta cac taa 
asp arg leu his OCH 



SEQ ID N° 14F 
FIGURE 14F 
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Sequence Rv3054c predite par Cole et 1. (Nature 393:537-544) 
pouvant etre en phase avec Seql4A' 

1/1 31/11 

ttg gcc 
leu ala 
91/31 
gcc aag 
ala lys 
151/51 
ttc tac 
phe tyr 
211/71 
gag gcc 
glu ala 
271/91 
ccg gcc 
pro ala 
331/111 
aag gac 
lys asp 
391/131 
cac gac 
his asp 
451/151 
ctg teg 
leu ser 
511/171 



gtg tea 
val ser 
61/21 


gat acc aag tec 
asp thr lys ser 


gac 
asp 


ate 
ile 


aaa 
lys 


ate 
ile 


teg ttc 
ser phe 
121/41 


aac cgc cag ate 
asn arg gin ile 


gcc 
ala 


gag 
glu 


ctg 
leu 


get 
ala 


ace atg 
thr met 
181/61 


ttc gag ggg ctg 
phe glu gly leu 


ggg 

gly 


gac 
asp 


ctg 
leu 


ccg 
pro 


gag gtg 
glu val 
241/81 


ccg gcg ccg gtg 
pro ala pro val 


age 
ser 


gcg 
ala 


ttg 
leu 


egg 
arg 


gtg gtc 
val val 
301/101 


acg ccg gaa tac 
thr pro glu tyr 


aac 
asn 


ggc 
al v 


age 
ser 


att 
ile 


ctg tec 
leu ser 
361/121 


agg cca ttc ggc 
arg pro phe gly 


gat 
asp 


ggc 

gly 


gcg 
ala 


ttg 
leu 


tec atg 
ser met 
421/141 


ggc cgc tac ggc 
gly arg tyr gly 


ggg 

gly 


gta 
val 


tgg 
trp 


gcg 
ala 


get ggc 
ala gly 
481/161 


acg egg gtg gtc 
thr arg val val 


gat 
asp 


gcg 
ala 


ate 
ile 


aaa 

lys 


teg gtc 
ser val 
541/181 


gcg gac gac gcc 
ala asp asp ala 


ggg 

gly 


ctg 
leu 


gcg 
ala 


gcg 
ala 


get gag 
ala glu 


gtc ggc tga 
val gly OPA 











tta 
leu 


gtg 
val 


gga 
gly 


age 
ser 


ctg 
leu 


cgc 
arg 


gcg 
ala 


gcg 
ala 


gtc 
val 


get 
ala 


ccg 
pro 


gac 
asp 


ggc 
gly 


gtc 
val 


acc 
thr 


gtc 
val 


aac 
asn 


gaa 
glu 


gac 
asp 


ate 
ile 


gac 
asp 


aca 
thr 


gcg 
ala 


acg 
thr 


gcg 
ala 


tct 
ser 


gac 
asp 


gcg 
ala 


cac 


get 

aid 


gcc 
axa 


ttg 
leu 


gtg 
val 


ate 
ile 


aag 
lys 


aac 
asn 


gcg 
ala 


ate 
ile 


gac 
asp 


tgg 
trp 


aag 
lys 


ccg 
pro 


ttg 
leu 


gcc 
ala 


gtg 
val 


ate 
ile 


ggc 
gly 


ggc 
gly 


gag 
glu 


act 
thr 


cgc aag 
arg lys 


teg 
ser 


ttc 
phe 


age 
ser 


ate 
ile 


gtg 
val 


ccg 
pro 


ttc 
phe 


caa 
gin 


act 
thr 


ctg 
leu 


ggc 
gly 


aag 
lys 


cgc 
arg 


gac 
asp 


gcc gtc 
ala val 


ggc 
gly 


aac 
asn 


ttg 
leu 


gcc 
ala 



SEQ ID N° 14R 
FIGURE 14R 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 
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ORF predite par Cole et al. (Nature 393:537-544) et contenant Rv3054c 



1/1 31/11 



taa cgc 
OCH arg 
61/21 


gat 
asp 


egg 
arg 


aat 
asn 


aaa 
lys 


teg 
ser 


gac 
asp 


cat 
his 


got cca att 
gly pro val 
91/31 


rtrtr* 

ggc 
gly 


•f" r*rt 

teg 
ser 


tgc 
cys 


aag 
lys 


gac 
asp 


gtg 
val 


gac 
asp 


caa 
gin 


caa gcg 
gin ala 
121/41 


gaa 
glu 


agg 
arg 


aac 
asn 


gta 
val 


gca 
ala 


gtg 
val 


tea 
ser 


gat acc aag 
asp thr lys 
151/51 


ser 


gac 
asp 


atC 

ile 


aaa 
lys 


acc 
ile 


ttg 
leu 


gee 
ala 


tta 
leu 


gtg gga 
val gly 
181/61 


age 
ser 


ctg 
leu 


cgc 
arg 


gcg 
ala 


gcg 
ala 


teg 
ser 


ttc 
phe 


aac cgc cag 
asn arg gin 
211/71 


ile 


ala 


gag 
glu 


ctg 
leu 


get 
ala 


gee 
ala 


aag 
lys 


gtc 
val 


get ccg 
ala pro 
241/81 


gac 
asp 


ggc 
gly 


gtc 
val 


ace 
thr 


gtc 
val 


acc 
thr 


atg 
met 


ttc aaa aaa 
wwv> yoy y y y 

phe glu gly 

271/91 


ctg 
leu 


999 
gly 


gac 
asp 


ctg 
leu 


ccg 
pro 


ttc 
phe 


tac 
tyr 


aac 
asn 


gaa gac 
glu asp 
301/101 


ate 
ile 


gac 
asp 


aca 
thr 


qcg 
ala 


a eg 
thr 


gag 
glu 


gtg 
val 


cca aca cca 
pro ala pro 
331/111 


gtg 
val 


age 
ser 


gcg 
ala 


ttg 
leu 


egg 
arg 


gag 
glu 


gee 
ala 


gcg 
ala 


tct gac 
ser asp 
361/121 


gcg 
ala 


cac 
his 


get 
ala 


gee 
ala 


ttg 
leu 


gtg 
val 


gtc 
val 


Pica ccn rrAA 

thr pro glu 
391/131 


tyr 


aac 
asn 


ggc 
gly 


age 
ser 


att 
ile 


ccg 
pro 


gee 
ala 


gtg 
val 


ate aag 
ile lys 
421/141 


aac 
asn 


gcg 
ala 


ate 
ile 


gac 
asp 


tgg 
trp 


ctg 
leu 


tec 
ser 


agg cca ttc 
arg pro phe 
451/151 


ggc 
gly 


gat 
asp 


ggc 
gly 


gcg 
ala 


ttg 
leu 


aag 
lys 


gac 
asp 


aag 
lys 


ccg ttg 
pro leu 
481/161 


gee 
ala 


gtg 
val 


ate 
ile 


ggc 
gly 


ggc 
gly 


tec 
ser 


atg 
met 


ggc cgc tac 
gly arg tyr 
511/171 


ggc 
gly 


999 
gly 


gta 
val 


tgg 
trp 


gcg 
ala 


cac 
his 


gac 
asp 


gag 
glu 


act cgc 
thr arg 
541/181 


aag 
lys 


teg 
ser 


ttc 
phe 


age 
ser 


ate 
ile 


get 
ala 


ggc 
gly 


acg egg gtg 
thr arg val 
571/191 


gtc 
val 


gat 
asp 


gcg 
ala 


ate 
ile 


aaa 
lys 


ctg 
leu 


teg 
ser 


gtg 
val 


ccg ttc 
pro phe 
601/201 


caa 
gin 


act 
thr 


ctg 
leu 


ggc 
gly 


aag 
lys 


teg 
ser 


gtc 
val 


gcg gac gac 
ala asp asp 
631/211 


gee 
ala 


999 
gly 


ctg 
leu 


gcg 
ala 


gcg 
ala 


aat 
asn 


gtg 
val 


cgc 
arg 


gac gec 
asp ala 


gtc 
val 


ggc 
gly 


aac 
asn 


ttg 
leu 


gee 
ala 


get 
ala 


gag 
glu 


gtc ggc tga 
val gly OPA 



















SEQ ID N° 14P 
FIGURE 14P 



FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 
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fragment d'apres la sequence publiee par Cole et al. (Nature 393:537-544) et contenant 
seq 14F 1 et seq 14P* 

1/1 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tgc aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly ser cys lys asp val asp gin 
asn ala ile gly ile asn arg thr met val arg leu ala arg ala arg thr trp thr asn 

61/21 ^ °° H ^ 3e 9i/3i 9ly arg gly Pr ° thr 

caa gcg gaa agg aac gta gca gtg tea gat ace aag tec gac ate aaa ate ttg gee tta 
gin ala glu arg asn val ala val ser asp thr lys ser asp ile lys ile leu ala leu 
lys arg lys gly thr AMB gin cys gin ile pro ser pro thr ser lys ser trp pro AMB 
ser gly lys glu arg ser ser val arg tyr gin val arg his gin asn leu gly leu ser 
121/41 151/51 

gtg gga age ctg cgc gcg gcg teg ttc aac cgc cag ate gee gag ctg get gee aag gtc 
val gly ser leu arg ala ala ser phe asn arg gin ile ala glu leu ala ala lys val 
trp glu ala cys ala arg arg arg ser thr ala arg ser pro ser trp leu pro arg ser 

181/61 lYS ^ Val Pr 211/7i a3P arg 9ln 9ly arg 

get ccg gac ggc gtc ace gtc ace atg ttc gag ggg ctg ggg gac ctg ccg ttc tac aac 
ala pro asp gly val thr val thr met phe glu gly leu gly asp leu pro phe tyr asn 
leu arg thr ala ser pro ser pro cys ser arg gly trp gly thr cys arg ser thr thr 
ser gly arg arg his arg his his val arg gly ala gly gly pro ala val leu gin ara 
241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gee gcg 
glu asp ile asp thr ala thr glu val pro ala pro val ser ala leu arg glu ala ala 

lys thr ser thr gin arg arg arg cys arg arg arg OPA ala arg cys gly arg pro arg 
arg his arg his ser asp gly gly ala gly ala gly glu arg val ala gly gly ara val 
301/101 331/111 * 

tct gac gcg cac get gec ttg gtg gtc acg ccg gaa tac aac ggc age att ccg gee gtg 
ser asp ala his ala ala leu val val thr pro glu tyr asn gly ser ile pro ala val 

leu thr arg thr leu pro trp trp ser arg arg asn thr thr ala ala phe arg pro OPA 
OPA arg ala arg cys leu gly gly his ala gly ile gin arg gin his ser gly arg asp 
361/121 3917131 

ate aag aac gcg ate gac tgg ctg tec agg cca ttc ggc gat ggc gcg ttg aag gac aag 
ile lys asn ala ile asp trp leu ser arg pro phe gly asp gly ala leu lys asp lys 
ser arg thr arg ser thr gly cys pro gly his ser ala met ala arg OPA arg thr ser 
gin glu arg- asp arg leu ala val gin ala ile arg arg trp arg val glu gly gin ala 
421/141 451/151 

ccg ttg gee gtg ate ggc ggc tec atg ggc cgc tac ggc ggg gta tgg gcg cac gac gag 
pro leu ala val ile gly gly ser met gly arg tyr gly gly val trp ala his asp glu 
arg trp pro OPA ser ala ala pro trp ala ala thr ala gly tyr gly arg thr thr arg 
val gly arg asp arg arg leu his gly pro leu arg arg gly met gly ala arg arg asp 
481/161 511/171 

act cgc aag teg ttc age ate get ggc acg egg gtg gtc gat gcg ate aaa ctg teg gtg 
thr arg lys ser phe ser ile ala gly thr arg val val asp ala ile lys leu ser val 
leu ala ser arg ser ala ser leu ala arg gly trp ser met arg ser asn cys arg cys 
ser gin val val gin his arg trp his ala gly gly arg cys asp gin thr val gly ala 
541/181 571/191 

ccg ttc caa act ctg ggc aag teg gtc gcg gac gac gee ggg ctg gcg gcg aat gtg cgc 
pro phe gin thr leu gly lys ser val ala asp asp ala gly leu ala ala asn val arg 
arg ser lys leu trp ala ser arg ser arg thr thr pro gly trp arg arg met cys ala 
val pro asn ser gly gin val gly arg gly arg arg arg ala gly gly glu C ys ala ara 
601/201 631/211 

gac gee gtc ggc aac ttg gec get gag gtc ggc tga tec ctg ggc cga ggc ggg tea gee 
asp ala val gly asn leu ala ala glu val gly OPA ser leu gly arg gly gly 3 er ala 
thr pro ser ala thr trp pro leu arg ser ala asp pro trp ala glu ala gly gin pro 
arg arg arg gin leu gly arg OPA gly arg leu ile pro gly pro arg arg val ser aln 
661/221 691/231 

aat age ggc tec ate ggc ttt get ggt age ggt teg gcg gga age tag egg cga cgt tgt 
asn ser gly ser ile gly phe ala gly ser gly ser ala gly ser AMB arg arg arg cys 
ile ala ala pro ser ala leu leu val ala val arg arg glu ala ser gly asp val val 
AMB arg leu his arg leu cys trp AMB arg phe gly gly lys leu ala ala thr leu ser 

SEQ ID N° 14Q 
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721/241 751/251 

egg tgg ccg gtg ata tat tgg gtc aga egg gta tgg egg egg ctg agg tga tct gcg aca 
arg trp pro val ile tyr trp val arg arg val trp arg arg leu arg OPA ser ala thr 
gly gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his 
val ala gly asp ile leu gly gin thr gly met ala ala ala glu val ile cys asp thr 
781/261 811/271 

cgc cgc cgc ggt get cga gee agg ctt acg ace agg gaa ttt cga aaa tgt tat tea gaa 
arg arg arg gly ala arg ala arg leu thr thr arg glu phe arg lys cys tyr ser glu 
ala ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn 
pro pro arg cys ser ser gin ala tyr asp gin gly ile ser lys met leu phe arg thr 
841/281 871/291 

cat ctt gta tct ctt etc cgt gee ace ccc tag gtg tag tgt ttt cga gta ccg gca gat 
his leu val ser leu leu arg ala thr pro AMB val AMB cys phe arg val pro ala asp 
ile leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile 
ser cys ile ser ser pro cys his pro leu gly val val phe ser ser thr gly aro ser 
901/301 931/311* 

ccc agg ttc acc agg tct cac cag ate cac ggg gcg cga tga act tec egg cat egg cat 
pro arg phe thr arg ser his gin ile his gly ala arg OPA thr ser arg his arg his 
pro gly ser pro gly leu thr arg ser thr gly arg asp glu leu pro gly ile gly ile 
gin val his gin val ser pro asp pro arg gly ala met asn phe pro ala ser ala ser 
961/321 991/331 

cgc cag gtc gac gga cgt ggt cgc get atg acg gga ate tgg age ctt gtc ggg ccg etc 
arg gin val asp gly arg gly arg ala met thr gly ile trp ser leu val gly pro leu 
ala arg ser thr asp val val ala leu OPA arg glu aer gly ala leu ser gly arg ser 
pro gly arg arg thr trp ser arg tyr asp gly asn leu glu pro cys arg ala ala oln 
1021/341 1051/351 

aac ata teg aag atg cac tac ttg agt cgt tgc cag ate ctg tea gat tec cga ttt ccg 
asn ile ser lys met his tyr leu ser arg cys gin ile leu ser asp ser arg phe pro 
thr tyr arg arg cys thr thr OPA val val ala arg ser cys gin ile pro asp phe arg 
his ile glu asp ala leu leu glu ser leu pro asp pro val arg phe pro ile ser ala 
1081/361 1111/371 
caa agg age ggt acg ccc atg acc gtg acc gtt tac act aa 
gin arg ser gly thr pro met thr val thr val tyr thr 
lys gly ala val arg pro OPA pro OPA pro phe thr leu 
lys glu arg tyr ala his asp arg asp arg leu his OCH 

SEQ ID N° 14Q (suite) 
FIGURE 14Q (suite) 



1/1 

CAA GCC CGG CCG CGA CTG TTT 
gin ala arg pro arg leu phe 
61/21 

GCG CAC CAT GGT GTG CAC CAG 
ala his his gly val his gin 
121/41 

CGA TGC CCG CGC CCC GGC GGC 
arg cys pro arg pro gly gly 
181/61 

GGC GGA CCA GTC GGC GAT GTC 
gly gly pro val gly asp val 
241/81 

GTC TGA GGT GGC GAA GAC CAG 
val OPA gly gly glu asp gin 









31/11 




GCC 


GTT 


TTG 


GGG CTC 


CTA 


ala 


val 


leu 


gly leu 


leu 








91/31 




TTG 


CGA 


TCG 


GTT CCT 


CCC 


leu 


arg 


ser 


val pro 


pro 








151/51 




GCA 


GCT 


GCG 


TAG CTC 


GAC 


ala 


ala 


ala 


AMB leu 


asp 








211/71 


GAG 


GCG 


ATG 


GCA ATA 


CAG 


glu 


ala 


met 


ala ile 


gin 








271/91 


TCC 


CGC 


GCC 


CAC CGG 


CAG 


ser 


arg 


ala 


his arg 


gin 



SEQ ID N° 15A 



CCA 


GAA 


CAC 


CAC 


CTG 


GCG 


GCC 


pro 


glu 


his 


his 


leu 


ala 


ala 


GCG 


CGC 


GGG 


CGG 


CGA 


CGA 


CGT 


ala 


arg 


gly 


arg 


arg 


arg 


arg 


CCG 


GTC 


GAC 


GAC 


GAC 


GGG 


GTC 


pro 


val 


asp 


asp 


asp 


gly 


val 


CGC 


CTT 


GGT 


GCG 


CGG 


CCA 


CAC 


arg 


leu 


gly 


ala 


arg 


pro 


his 


CCG 


GAT 


CCG 


GAT 


ACG 


CGG 


TAC 


pro 


asp 


pro 


asp 


thr 


arg 


tyr 



FEUILLE DE REMPlflSSBM&WKREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



AAG CCC 


GGC 


CGC 


GAC 


TGT 


lys pro 


gly 


arg 


asp 


cys 


62/21 










CGC ACC 


ATG 


GTG 


TGC 


ACC 


arg thr 


met 


val 


cys 


thr 


122/41 










GAT GCC 


CGC 


GCC 


CCG 


GCG 


asp ala 


ara 


ala 


pro 


ala 


182/61 










GCG GAC 


CAG 


TCG 


GCG 


ATG 


ala asp 


gin 


ser 


ala 


met 


242/81 










TCT GAG 


GTG 


GCG 


AAG 


ACC 


ser glu 


val 


ala lys thr 


AGC CCG 


GCC 


GCG 


ACT 


GTT 


ser pro 


ala 


ala 


thr 


val 


63/21 










GCA CCA 


TGG 


TGT 


GCA 


CCA 


ala pro 


trp 


cys 


ala 


pro 


123/41 








ATG CCC 


GCG 


CCC 


CGG 


CGG 


met pro 


ala 


pro 


arg 


arg 


183/61 










CGG ACC 


AGT 


CGG 


CGA 


TGT 


arg thr 


ser 


arg 


arg 


cys 


243/81 










CTG AGG 


TGG 


CGA AGA 


CCA 


leu arg 


trp 


arg 


arg 


pro 



50/185 



32/11 

TTG CCG TTT TGG GGC TCC TAC 
leu pro phe trp gly ser tyr 
92/31 

AGT TGC GAT CGG TTC CTC CCG 
ser cys asp arg phe leu pro 
152/51 

GCG CAG CTG CGT AGC TCG ACC 
ala gin leu arg ser ser thr 
212/71 

TCG AGG CGA TGG CAA TAC AGC 
ser arg arg trp gin tyr ser 
272/91 

AGT CCC GCG CCC ACC GGC AGC 
ser pro ala pro thr gly ser 



SEQ ID N° 15B 
FIGURE 15B 











33/11 




TGC 


CGT 


TTT 


GGG 


GCT CCT 


ACC 


cys 


arg phe 


gly 


ala pro 


thr 










93/31 




GTT 


GCG 


ATC 


GGT 


TCC TCC 


CGC 


val 


ala 


ile 


gly 


ser ser 


arg 










153/51 


CGC 


AGC 


TGC 


GTA 


GCT CGA 


CCC 


arg 


ser 


cys 


val 


ala arg 


pro 










213/71 




CGA 


GGC 


GAT 


GGC 


AAT ACA 


GCG 


arg gly asp 


gly 


asn thr 


ala 










273/91 




GTC 


CCG 


CGC 


CCA 


CCG GCA 


GCC 


val 


pro 


arg 


pro 


pro ala 


ala 



SEQ ID N° 15C 
FIGURE 15C 



CAG 
gin 


AAC 
asn 


ACC 
thr 


ACC 
thr 


TGG 
trp 


CGG 
arg 


CCG 
pro 


CGC 
arg 


GCG 
ala 


GGC GGC 
gly gly 


GAC 
asp 


GAC 
asp 


GTC 
val 


CGG 
arg 


TCG 
ser 


ACG 
thr 


ACG 
thr 


ACG 
thr 


GGG 
gly 


TCG 
ser 


GCC 
ala 


TTG 
leu 


GTG 
val 


CGC 
arg 


GGC 
gly 


CAC 
his 


ACG 
thr 


CGG 
arg 


ATC 
ile 


CGG 
arg 


ATA 
ile 


CGC 
arg 


GGT 
gly 


AC 


AGA ACA 
arg thr 


CCA 
pro 


CCT 
pro 


GGC 
alv 


GGC 
a 1 v 


CGC 
a rg 


GCG 
ala 


CGG 
arg 


GCG 
ala 


GCG 
ala 


ACG 
thr 


ACG 
thr 


TCG 
ser 


GGT CGA 
gly arg 


CGA 
arg 


CGA 
arg 


CGG 
arg 


GGT 
gly 


CGG 
arg 


CCT 
pro 


TGG 
trp 


TGC 
cys 


GCG 
ala 


GCC 
ala 


ACA 
thr 


CGT 
arg 


GGA TCC 
gly ser 


GGA TAC 
gly tyr 


GCG 
ala 


GTA 
val 


C 
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partie de la sequence nucleotidique de seql5A 
1/1 31/11 

GGC GGC CGC GCG CCA TGG TGT GCA CCA GTT GCG ATC GGT TCT CCC GCG CGC GGG CGG CGA 
gly gly arg ala pro trp cys ala pro val ala ile gly ser pro ala arg gly arq ara 
61/21 91/31 * 

CGA CGT CGA TGG CCG CGC CCC GGC GGC TGC AGC TGC GTA GCT CGA CCC GGT CGA CGA CGA 
arg arg arg trp pro arg pro gly gly cys ser cys val ala arg pro gly arg ara ara 
121/41 151/51 

CGG GGT CGG CGG GCC AGT CGG CGA TGT CGA GGC GAT GGC AAT ACA GCG CCT TGG TGC GCG 
arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro trp cys ala 
181/61 211/71 

GCC ACA CGT CTG AGG TGG CGA AGA CCA GTC CCG CGC CCA CCG GCA GCC GGA TC 
ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 

SEQ ID N° 15A' 
FIGURE 15A' 

1/1 31/11 

GCG GCC GCG CGC CAT GGT GTG CAC CAG TTG CGA TCG GTT CTC CCG C 
ala ala ala arg his gly val his gin leu arg ser val leu Dro a 
61/21 91/31 

GAC GTC GAT GGC CGC GCC CCG GCG GCT GCA GCT GCG TAG CTC GAC C 
asp val asp gly arg ala pro ala ala ala ala ala AMB leu asp p 
121/41 • 151/51 

GGG GTC GGC GGG CCA GTC GGC GAT GTC GAG GCG ATG GCA ATA CAG C 
gly val gly gly pro val gly asp val glu ala met ala ile gin a 
181/61 211/71 



SEQ ID N° 15B» 
FIGURE 15B' 



GCG 


GGC 


GGC 


GAC 


ala 


gly 


gly asp 


GTC 


GAC 


GAC 


GAC 


val 


asp 


asp 


asp 


CTT 


GGT 


GCG 


CGG 


leu 


gly 


ala 


arg 


GAT 


C 






asp 









1/1 


















31/11 


















TGG CGG 


CCG 


CGC 


GCC 


ATG 


GTG 


TGC 


ACC 


AGT 


TGC GAT 


CGG 


TTC 


TCC 


CGC 


GCG 


CGG 


GCG 


GCG 


trp arg 
61/21 


pro 


arg 


ala 


met 


val 


cys 


thr 


ser 


cys asp 
91/31 * 


arg 


phe 


ser 


arg 


ala 


arg 


ala 


ala 


ACG ACG 


TCG 


ATG 


GCC 


GCG 


CCC 


CGG 


CGG 


CTG 


CAG CTG 


CGT 


AGC 


TCG 


ACC 


CGG 


TCG 


ACG 


ACG 


thr thr 


ser 


met 


ala 


ala 


pro 


arg 


arg 


leu 


gin leu 


arg 


ser 


ser 


thr 


arg 


ser 


thr 


thr 


121/41 


















151/51 










ACG GGG 


TCG 


GCG 


GGC 


CAG 


TCG 


GCG 


ATG 


TCG 


AGG CGA 


TGG 


CAA 


TAC 


AGC 


GCC 


TTG 


GTG 


CGC 


thr gly 


ser 


ala 


gly gin 


ser 


ala 


met 


ser 


arg arg 


trp 


gin 


tyr 


ser 


ala 


leu 


val 


arg 


181/61 


















211/71 












GGC CAC 


ACG 


TCT 


GAG 


GTG 


GCG 


AAG 


ACC 


AGT 


CCC GCG 


CCC 


ACC 


GGC 


AGC 


CGG 


ATC 






gly his 


thr 


ser 


glu 


val 


ala 


lys 


thr 


ser 


pro ala 


pro 


thr 


gly 


ser 


arg 


ile 







SEQ ID N° 15C 



FEUILLE DE REMBLAfiSMENit (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



52/185 



ORF contenant SeqlSA 1 d'apres Cole et al. (Nature 393:537-544) 



1/1 

taa ggt 
OCH gly 
61/21 
cgt agt 
arg ser 
121/41 
agg ggt 
arg gly 
181/61 
egg tgg 
arg trp 
241/81 
cca cct 
pro pro 
301/101 
egg cga 
arg arg 
361/121 
cga cga 
arg arg 
421/141 
tgc gcg 
cys ala 
481/161 
ggt agg 
gly arg 
541/181 
agg gta 
arg val 
601/201 
cga agg 
arg arg 



ccg 
pro 


cca 
pro 


a eg 
thr 


ctt 
leu 


tac 
tyr 


get 
ala 


cgc 
arg 


cgc 
arg 


agg 
arg 


gca 
ala 


ggg 

gly 


ctt 
leu 


age 
ser 


gtt 
val 


cgt 
arg 


ggg 

gly 


cgt 
arg 


cga 
arg 


ggg 

gly 


tgc 
cys 


gca 
ala 


cgc 
arg 


ccg 
pro 


gee 
ala 


ggc 
gly 


ggc 
gly 


cgc 
arg 


gcg 
ala 


cca 
pro 


tgg 
trp 


cga 
arg 


cgt 
arg 


cga 
arg 


tgg 
trp 


ccg 
pro 


cgc 
arg 


egg 
arg 


ggt 
gly 


egg 
arg 


egg 
arg 


gee 
ala 


agt 
ser 


gee 
ala 


aca 
thr 


cgt 
arg 


ctg 
leu 


agg 
arg 


tgg 
trp 


gca 
ala 


ggc 
gly 


gcg 
ala 


agt 
ser 


ctt 
leu 


cag 
gin 


egg 
arg 


gcg 
ala 


gcg 
ala 


tac 
tyr 


ggc 
gly 


aac 
asn 


ggc 
gly 


agg 
arg 


tga 
OPA 









31/11 
egg ccg cca 
arg pro pro 

91/31 
gcg teg tct 
ala ser ser 

151/51 
cga tgt gca 
arg cys ala 

211/71 
act gtt tgc 
thr val cys 

271/91 
gca cca gtt 
ala pro val 

331/111 
ggc ggc tgc 
gly gly cys 

391/131 
cga tgt cga 
arg cys arg 

451/151 
aga cca gtc 
arg pro val 

511/171 
ggt tgg egg 
gly trp arg 

571/191 
gaa gca ggc 
glu ala gly 



cga 
arg 


gtt 
val 


ggc 
gly 


egg 
arg 


cca 
pro 


ctt 
leu 


tea 
ser 


ggc 
gly 


teg 
ser 


egg 
arg 


gtt 
val 


tgt 
cys 


egg 
arg 


caa 
gin 


agg 
arg 


tgt 
cys 


get 
ala 


egg 
arg 


gga 
gly 


tgc 
cys 


egg 
arg 


egg 
arg 


cgc 
arg 


ggg 

gly 


gcg 
ala 


ttt 
phe 


tgg 
trp 


ggc 
gly 


tct 
ser 


gee 
ala 


aga 
arg 


aca 
thr 


gcg 
ala 


ate 
ile 


ggt 

gly 


tct 
ser 


ccc 
pro 


gcg 
ala 


cgc 
arg 


ggg 

gly 


age 
ser 


tgc 
cys 


gta 
val 


get 
ala 


cga 
arg 


ccc 
pro 


ggt 
gly 


cga 
arg 


ggc 
gly 


gat 
asp 


ggc 
gly 


aat 
asn 


aca 
thr 


gcg 
ala 


cct 
pro 


tgg 
trp 


ccg 
pro 


cgc 
arg 


cca 
pro 


ccg 
pro 


gca 
ala 


gee 
ala 


gga 
gly 


tea 
ser 


cga 
arg 


cga 
arg 


gca 
ala 


get 
ala 


cca 
pro 


cag 
gin 


agt 
ser 


gtg 
val 


act 
thr 


ccg 
pro 


acg 
thr 


aac 
asn 


cca 
pro 


teg 
ser 


tea 
ser 


cgt 
arg 



SEQ ID N° 15F 
FIGURE 15F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

53/185 



R:Rv2530c predite d'apres Cole et al. 

phase avec SEQ15A 

1/1 

gtg acg gca ctg etc gat gtc aat gtg ctg 
val thr ala leu leu asp val asn val leu 
61/21 

cat gcg gcc gcg cag cga tgg ttc acg cag 
his ala ala ala gin arg trp phe thr gin 
121/41 

ate acc gag gca ggg tat gtc cga att tea 
ile thr glu ala gly tyr val arg ile ser 
181/61 

acg ccg get ate gcg ate get cag ttg gcg 
thr pro ala ile ala ile ala gin leu ala 
241/81 

tgg cct gac gat gtg cca ctg ate gtt ggg 
trp pro asp asp val pro leu ile val gly 
301/101 

cac cgt egg gtc acc gac tgc cat etc ate 
his arg arg val thr asp cys his leu ile 
361/121 

gtc aca ttc gat gcc gca ctg gcc gat tea 
val thr phe asp ala ala leu ala asp ser 



(Nature 393 : 537-544 ) et pouvant etre en 



31/11 


















ate gcg 
ile ala 
91/31 


ctg 
leu 


ggc 
gly 


taa 
trp 


ccg 
pro 


aat 
asn 


cac 
his 


val 


cac 
his 


ttc tec 
phe ser 
151/51 


teg 
ser 


aat 
asn 


gly 


taa 
trp 


gcc 
ala 


acc 
thr 


acg 
thr 


ccg 
pro 


age aat 
ser asn 
211/71 


cere 
arg 


aat 
ser 


val 


atg 
met 


cag 
gin 


gcg 
val 


teg 
ser 


acc 
thr 


gcg atg 
ala met 
271/91 


act 
thr 


tct 
ser 


ctt 
leu 


gcc 
ala 


ggg 

gly 


cac 
his 


acg 
thr 


ttt 
phe 


age gcc 
ser ala 
331/111 


ggc 
gly 


gat 
asp 


cgc 
arg 


gat 
asp 


gcg 
ala 


gtg 
val 


tec 
ser 


aac 
asn 


gcc ttg 
ala leu 
391/131 


gcc 
ala 


gcg 

ala 


cgc 
arg 


tac 
tyr 


ggg 

gly 


ggc 
gly 


egg 
arg 


ttg 
leu 


gca tec 
ala ser 


gca 
ala 


ggc 
gly 


etc 
leu 


gtc 
val 


gag 
glu 


gtg 
val 


ttg 
leu 


tag 
AMB 



SEQ ID N° 15R 
FIGURE 15R 



SeqlSP: ORF d'apres Cole et al. (Nature 393:537-544) contenant Rv2530c 

!/l 31/11 

tga tgt tec gcc gga tgc gcc gac ggt gac ttc cga gga tgt cgt ccg cgc get cga gga 

OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 

61/21 91 / 31 ? * J 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ccg aat cac 

arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro asn his 

121/41 151/51 

gtt cac cat gcg gcc gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gcc acc 

val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 

181/61 211/71 

acg ccg ate acc gag gca ggg tat gtc cga att tea age aat cgc agt gtg atg cag gtg 

thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 

241/81 271/91 

teg acc acg ccg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gcc ggg cac 

ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala alv his 

301/101 331/111 

acg ttt tgg cct gac gat gtg cca ctg ate gtt ggg age gcc ggc gat cgc gat gcg gtg 

thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 

361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gcc ttg gcc gcg cgc tac ggg ggc 

ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tvr glv alv 

421/141 451/151 ^ Y 9 y 

egg ttg gtc aca ttc gat gcc gca ctg gcc gat tea gca tec gca ggc etc gtc gag gtg 

arg leu val thr phe asp ala ala leu ala. asp ser ala ser ala cly leu val alu val 

481/161 y 
ttg tag 
leu AMB 

SEQ ID N° 15P 



FEUILLE DE REMf^glfl|^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



54/185 



Fragment contenant SeqlSP 1 et Seq 15F' 
1/1 * ' 31/11 

tga tgt tec gec gga tgc gec gac ggt gac ttc cga gga tgt cgt ceg cgc get cga gga 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
asp val pro pro asp ala pro thr val thr ser glu asp val val arg ala leu glu asp 
Met phe arg arg met arg arg arg OPA leu pro arg met ser ser ala arg ser ara thr 
61/21 91/31 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ceg aat cac 
arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro asn his 
asp val OPA arg his cys ser met ser met cys OPA ser arg trp ala gly arg ile thr 
thr cys asp gly thr ala arg cys gin cys ala asp arg ala gly leu ala glu ser arq 
121/41 151/51 

gtt cac cat gcg gee gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gec acc 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 
phe thr met arg pro arg ser asp gly ser arg ser ser pro arg met gly gly pro pro 

ser pro cys gly arg ala ala met val his ala val leu leu glu trp val gly his his 
181/61 211/71 

acg ceg ate acc gag gca ggg tat gtc cga att tea age aat cgc agt gtg atg cag gtg 
thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 
arg arg ser pro arg gin gly met ser glu phe gin ala ile ala val OPA cys arg cys 
ala asp his arg gly arg val cys pro asn phe lys gin ser gin cys asp ala qly val 
241/81 271/91 

teg acc acg ceg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gec ggg cac 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
arg pro arg arg leu ser arg ser leu ser trp arg arg OPA leu leu leu pro gly thr 
asp his ala gly tyr arg asp arg ser val gly gly asp asp phe ser cys arg ala his 
301/101 331/111 

acg ttt tgg cct gac gat gtg cca ctg ate gtt ggg age gec ggc gat cgc gat gcg gtg 
thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 
arg phe gly leu thr met cys his OPA ser leu gly ala pro ala ile ala met arg cys 
val leu ala OPA arg cys ala thr asp arg trp glu arg arg arg ser arg cys gly vai 
361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gec ttg gec gcg cgc tac ggg ggc 
ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tyr gly gly 
pro thr thr val gly ser pro thr ala ile ser ser pro trp pro arg ala thr gly ala 
gin pro pro ser gly his arg leu pro ser his arg leu gly arg ala leu arg gly pro 
421/141 451/151 

egg ttg gtc aca ttc gat gec gca ctg gec gat tea gca tec gca ggc etc gtc gag gtg 
arg leu val thr phe asp ala ala leu ala asp ser ala ser ala gly leu val glu val 
gly trp ser his ser met pro his trp pro ile gin his pro gin ala ser ser arg cys 
val gly his ile arg cys arg thr gly arg phe ser ile arg arg pro arg arg gly val 
481/161 511/171 

ttg tag tea ceg ggg atg ggc ggc teg cca ggc ctg cag gat ctg egg gcg cag gcg ccc 
leu AMB ser pro gly met gly gly ser pro gly leu gin asp leu arg ala gin ala pro 
cys ser his arg gly trp ala ala arg gin ala cys arg ile cys gly arg arg arg pro 
val val thr gly asp gly arg leu ala arg pro ala gly ser ala gly ala gly ala pro 
541/181 571/191 

ceg gtc gga cac egg cag gec gac get ttt ggc cca cgc gcg cag etc ggc get get ggg 
pro val gly his arg gin ala asp ala phe gly pro arg ala gin leu gly ala ala gly 
arg ser asp thr gly arg pro thr leu leu ala his ala arg ser ser ala leu leu gly 
gly arg thr pro ala gly arg arg phe trp pro thr arg ala ala arg arg cys trp ala 
601/201 631/211 y P 

etc ggg etc ggc ggc age egg etc gaa aac cgt ggt ggc gtc ggc ate gtc gac gaa cca 
leu gly leu gly gly ser arg leu glu asn arg gly gly val gly ile val asp glu pro 
ser gly ser ala ala ala gly ser lys thr val val ala ser ala ser ser thr asn gin 
arg ala arg arg gin pro ala arg lys pro trp trp arg arg his arg arg arg thr arg 



SEQ ID N° 15Q 

FIGURE 15Q 
FEUILLE DE REPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



55/185 



661/221 691/231 

ggt gag ggc ggc ggc tag ata gcg gta ggt gta ttc ctg ggc gag ctt gcg ggt ttg gca 
gly glu gly gly gly AMB ile ala val gly val phe leu gly glu leu ala gly leu ala 
val arg ala ala ala arg AMB arg AMB val tyr ser trp ala ser leu arg val trp gin 
OPA gly arg arg leu asp ser gly arg cys ile pro gly arg ala cys gly phe gly arg 
721/241 751/251 

gaa cac gat egg cac gtt ggg aaa gec gat ctg caa ttc ggc cag ccc ate ggc gat cgc 
glu his asp arg his val gly lys ala asp leu gin phe gly gin pro ile gly asp arg 
asn thr ile gly thr leu gly lys pro ile cys asn ser ala ser pro ser ala ile ala 
thr arg ser ala arg trp glu ser arg ser ala ile arg pro ala his arg arg ser pro 
781/261 811/271 

cgt egg gcg ggc gaa gga gtg cgc gaa gat etc cga gta gcg gtc etc gac cac cac ggc 
arg arg ala gly glu gly val arg glu asp leu arg val ala val leu asp his his gly 
val gly arg ala lys glu cys ala lys ile ser glu AMB arg ser ser thr thr thr ala 
ser gly gly arg arg ser ala arg arg ser pro ser ser gly pro arg pro pro arg arc 
841/281 871/291 

ggc ccg tgg cag cgc ggc cag ttc ggt cag ttg gta ttt cag gtt gec gtt cag cac gee 
gly pro trp gin arg gly gin phe gly gin leu val phe gin val ala val gin his ala 

ala arg gly ser ala ala ser ser val ser trp tyr phe arg leu pro phe ser thr pro 
pro val ala ala arg pro val arg ser val gly ile ser gly cys arg ser ala arg gin 
901/301 931/311 "~~ 

aga agt aag gtc cgc caa cgc ttt acg etc gac ggc cgc cac gag ttg gec ggc cac ttt 
arg ser lys val arg gin arg phe thr leu asp gly arg his glu leu ala gly his phe 

glu val arg ser ala asn ala leu arg ser thr ala ala thr ser trp pro ala thr phe 
lys OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro leu ser 
961/321 991/331 

cag gee gta gtc gee gca ggg cag ggc ttc ccg cgt cgt ctt cgc ggg ttt gtc ggc aaa 
gin ala val val ala ala gly gin gly phe pro arg arg leu arg gly phe val gly lys 
arg pro AMB ser pro gin gly arg ala ser arg val val phe ala gly leu ser ala lys 
gly arg ser arg arg arg ala gly leu pro ala ser ser ser arg val cys arg gin arc 
1021/341 1051/351 

ggt gta ggg gta gcg ttc gtg ggc gtc gac gac gat gtg cag etc ggg gat gec ggc ggc 
gly val gly val ala phe val gly val asp asp asp val gin leu gly asp ala gly gly 
val AMB gly AMB arg ser trp ala ser thr thr met cys ser ser gly met pro ala ala 

cys arg gly ser val arg gly arg arg arg arg cys ala ala arg gly cys arg arg arg 
1081/361 1111/371 

gcg ggc ggt ggg ggt gcg cac gee egg ccg cga ctg ttt gcg cgt ttt ggg get ctg cca 
ala gly gly gly gly ala his ala arg pro arg leu phe ala arg phe gly ala leu pro 
arg ala val gly val arg thr pro gly arg asp cys leu arg val leu gly leu cys gin 
gly arg trp gly cys ala arg pro ala ala thr val cys ala phe trp gly ser ala arg 
1141/381 1171/391 

gaa cac cac ctg gcg gee gcg cgc cat ggt gtg cac cag ttg cga teg gtt etc ccg cgc 
glu his his leu ala ala ala arg his gly val his gin leu arg ser val leu pro arg 
asn thr thr trp arg pro arg ala met val cys thr ser cys asp arg phe ser arg ala 
thr pro pro gly gly arg ala pro trp cys ala pro val ala ile gly ser pro ala arg 
1201/401 1231/411 9 

gcg ggc ggc gac gac gtc gat ggc cgc gee ccg gcg get gca get gcg tag etc gac ccg 
ala gly gly asp asp val asp gly arg ala pro ala ala ala ala ala AMB leu asp pro 
arg ala ala thr thr ser met ala ala pro arg arg leu gin leu arg ser ser thr arg 
gly arg arg arg arg arg trp pro arg pro gly gly cys ser cys val ala arg pro gly 
1261/421 1291/431 * * 

gtc gac gac gac ggg gtc ggc ggg cca gtc ggc gat gtc gag gcg atg gca ata cag cgc 
val asp asp asp gly val gly gly pro val gly asp val glu ala met ala ile gin arg 
ser thr thr thr gly ser ala gly gin ser ala met ser arg arg trp gin tyr ser ala 
arg arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro 



SEQ ID N° 15Q (suite 1) 
FIGURE 15Q (suite 1) 



FEUILLE DE REPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



56/185 



1321/441 1351/451 

ctt ggt gcg egg cca cac gtc tga ggt ggc gaa gac cag tec cgc gee cac egg cag ccg 
leu gly ala arg pro his val OPA gly gly glu asp gin ser arg ala his arg gin pro 

leu val arg gly his thr ser glu val ala lys thr ser pro ala pro thr gly ser arg 
trp cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala glv 
1381/461 1411/471 1 

gat cag gta ggg cag gcg cga gtc ttc age ggg gtt ggc ggc gac gag cag etc cac aga 
asp gin val gly gin ala arg val phe ser gly val gly gly asp glu gin leu his arg 

ile arg AMB gly arg arg glu ser ser ala gly leu ala ala thr ser ser ser thr glu 
ser gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro qln ser 
1441/481 1471/491 

gtg tga ggg tac ggg egg cgt acg gca acg gtg aag cag gca etc cga cga ace cat cgt 
val OPA gly tyr gly arg arg thr ala thr val lys gin ala leu arg arg thr his arg 
cys glu gly thr gly gly val arg gin arg OPA ser arg his ser asp glu pro ile val 
val arg val arg ala ala tyr gly asn gly glu ala gly thr pro thr asn pro ser ser 

1jU1/s)U1 

cac gtc gaa ggg gca ggt ga 
his val glu gly ala gly 
thr ser lys gly gin val 
arg arg arg gly arg OPA 



SEQ ID N° 15Q (suite 2) 
FIGURE 15Q (suite (2) 



TGC GCA 


TGC 


CGA 


CCA 


GTG 


TGG 


cys ala 
61/21 


cys 


arg 


pro 


val 


trp 


CGA TAT 


AAC 


CAC 


TCT 


AGT 


CAC 


arg tyr 
121/41 


asn 


his 


ser 


ser 


his 


CAT GCA 


TTC 


GCG 


ACC 


GCG 


GGA 


his ala 
181/61 


phe 


ala 


thr 


ala gly 


GAC TTC 


CGT 


GCC 


GAA 


CCG 


ACG 


asp phe 
241/81 


arg 


ala 


glu 


pro 


thr 


CCT GGC 


AGT 


TGC 


AAG 


TCC 


TTG 


pro gly 
301/101 


ser 


cys 


lys 


ser 


leu 


GCG GCC 


CGA 


GCA 


CCA 


TGA ATT 


ala ala 
361/121 


arg 


ala 


pro 


OPA 


ile 


GAT GTC 


CGC 


GCT 


ATC 


GCA 


GGG 


asp val 


arg 


ala 


ile 


ala gly 









31/11 




TTG 


GCC 


GGA 


GTT CGT 


TTG 


leu 


ala 


gly 


val arg 


leu 








91/31 




ATC 


AAC 


CAC 


ACT CGT 


ACC 


ile 


asn 


his 


thr arg 


thr 








151/51 




GCC 


GGC 


GAA 


CCC GGC 


GCC 


ala 


gly 


glu 


pro gly 


ala 








211/71 




CCG 


ACG 


CAA 


GCT TTC 


GAC 


pro 


thr 


gin 


ala phe 


asp 








271/91 




TGC 


ATA 


TTT 


TCT TGT 


CTA 


cys 


ile 


phe 


ser cys 


leu 








331/111 




CAA 


GCA 


GGC 


GGC GGT 


GTT 


gin 


ala 


gly 


gly gly 


val 








391/131 




GTT 


GTC 


CCA 


GTT CGG 


GAT 


val 


val 


pro 


val arg 


asp 



SEQ ID N° 16A 
FIGURE 16A 



TTC 


GCG 


ATT 


GCC 


TCA 


ACG 


ATT 


phe 


ala 


ile 


ala 


ser 


thr 


ile 


ATC 


GAG 


CGT 


GTG 


GGT 


TCA 


TGC 


ile 


glu 


arg 


val 


gly 


ser 


cys 


ACA 


CAT 


AAT 


CCA 


GAT 


TGA 


GGA 


thr 


his 


asn 


pro 


asp 


OPA 


gly 


AGC 


CAT 


GAG 


CGC 


GGT 


CGC 


CGC 


ser 


his 


glu 


arg 


gly 


arg 


arg 


CGA 


ATC 


AAC 


CGA 


AAC 


GAC 


CGA 


arg 


ile 


asn 


arg 


asn 


asp 


arg 


GAC 


CGA 


CCT 


GCC 


CGG 


CGA 


GCT 


asp 


arg 


pro 


ala 


arg 


arg 


ala 



c 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



57/185 



32/11 



GCG CAT 


GCC 


GAC 


CAG 


TGT 


GGT 


TGG 


CCG 


GAG 


/ XX 

TTC GTT 


TGT 


TCG 


CGA 


TTG 


CCT 


CAA 


CGA 


TTC 


ala his 


ala 


asp 


gin 


cys gly trp pro glu 


phe val 


cys 


ser 


arg 


leu 


pro 


gin 


arg 


phe 


62/21 


















92/31 












GAT ATA 


ACC 


ACT 


CTA 


GTC ACA TCA ACC ACA 


CTC GTA 


CCA TCG 


AGC 


GTG 


TGG 


GTT 


CAT 


GCC 


asp ile 


thr 


thr 


leu 


val 


thr 


ser 


thr 


thr 


leu val 


pro 


ser 


ser 


val 


trp 


val 


his 


ala 


122/41 


















152/51 
















ATG CAT 


TCG 


CGA 


CCG 


CGG 


GAG 


CCG 


GCG 


AAC 


CCG GCG 


CCA CAC ATA ATC 


CAG 


ATT 


GAG 


GAG 


met his 


ser 


arg 


pro 


arg glu pro ala 


asn 


pro ala 


pro 


his 


ile 


ile 


gin 


ile 


glu 


glu 


182/61 


















212/71 












ACT TCC 


GTG 


CCG 


AAC 


CGA 


CGC 


CGA 


CGC 


AAG 


CTT TCG 


ACA 


GCC 


ATG 


AGC 


GCG 


GTC 


GCC 


GCC 


thr ser 


val 


pro 


asn 


arg arg arg arg lys 


leu ser 


thr 


ala 


met 


ser 


ala 


val 


ala 


ala 


242/81 


















272/91 
















CTG GCA 


GTT 


GGA 


AGT 


CCT 


TGT 


GCA 


TAT 


TTT 


CTT GTC 


TAC 


GAA 


TCA ACC 


GAA 


ACG 


ACC 


GAG 


leu ala 


val 


ala 


ser 


pro 


cys 


ala tyr phe 


leu val 


tyr glu 


ser 


thr 


glu 


thr 


thr 


glu 


302/101 


















332/111 














CGG CCC 


GAG 


CAC 


CAT 


GAA 


TTC 


AAG 


CAG 


GCG 


GCG GTG 


TTG 


ACC 


GAC 


CTG 


CCC 


GGC 


GAG 


CTG 


arg pro 


glu 


his 


his 


glu phe lys 


gin ala 


ala val 


leu 


thr 


asp 


leu 


pro 


gly 


glu 


leu 


362/121 


















392/131 










ATG TCC 


GCG 


CTA 


TCG 


CAG 


GGG 


TTG 


TCC 


CAG 


TCC GGG 


ATC 
















met ser 


ala 


leu 


ser 


gin gly leu 


ser 


gin 


phe gly ile 






























SEQ ID 


N° 16B 






























FIGURE 16B 




































33/11 


















CGC ATG 


CCG 


ACC 


AGT 


GTG 


GTT 


GGC 


CGG 


AGT 


TCG TTT 


GTT 


CGC 


GAT 


TGC 


CTC 


AAC 


GAT 


TCG 


arg met 


pro 


thr 


ser 


val 


val 


gly arg 


ser 


ser phe 


val 


arg 


asp 


cys 


leu 


asn 


asp 


ser 


63/21 


















93/31 










ATA TAA 


CCA 


CTC 


TAG 


TCA 


CAT 


CAA 


CCA 


CAC 


TCG TAC 


CAT 


CGA 


GCG 


TGT 


GGG 


TTC 


ATG 


CCA 


ile OCH 


pro 


leu 


AMB 


ser 


his 


gin pro 


his 


ser tyr 


his 


arg 


ala 


cys 


gly 


phe 


met 


pro 


123/41 


















153/51 










TGC ATT 


CGC 


GAC 


CGC 


GGG 


AGC 


CGG 


CGA 


ACC 


CGG CGC 


CAC 


ACA 


TAA 


TCC 


AGA 


TTG 


AGG 


AGA 


cys ile 


arg 


asp 


arg 


gly 


ser 


arg 


arg 


thr 


arg arg 


his 


thr 


OCH 


ser 


arg 


leu 


arg 


arg 


LOO/ Dl 


















213/71 












CTT CCG 


TGC 


CGA 


ACC 


GAC 


GCC 


GAC 


GCA 


AGC 


TTT CGA 


CAG 


CCA 


TGA 


GCG 


CGG 


TCG 


CCG 


CCC 


leu pro 


cys 


arg 


thr 


asp 


ala 


asp 


ala 


ser 


phe arg 


gin 


pro 


OPA 


ala 


arg 


ser 


pro 


pro 


243/81 


















273/91 












TGG CAG 


TTG 


CAA 


GTC 


CTT 


GTG 


CAT ATT 


TTC 


TTG TCT 


ACG 


AAT 


CAA 


CCG 


AAA 


CGA 


CCG 


AGC 


trp gin 


leu 


gin 


val 


leu 


val 


his 


ile 


phe 


leu ser 


thr 


asn 


gin pro 


lys 


arg 


pro 


ser 


303/101 


















333/111 










GGC CCG 


AGC 


ACC 


ATG 


AAT 


TCA 


AGC 


AGG 


CGG 


CGG TGT 


TGA 


CCG 


ACC 


TGC 


CCG 


GCG 


AGC 


TGA 


gly pro 


ser 


thr 


met 


asn 


ser 


ser 


arg 


arg 


arg cys 


OPA 


pro 


thr 


cys 


pro 


ala 


ser 


OPA 


363/121 


















393/131 














TGT CCG 


CGC 


TAT 


CGC 


AGG 


GGT 


TGT 


CCC 


AGT 


TCG GGA 


TC 
















cys pro 


arg 


tyr 


arg 


arg gly 


cys 


pro 


ser 


ser gly 



















SEQ ID N° 16C 
FIGURE 16C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



GCG GGC 

www Www 


CAC 


CGA 


TCA 


GTC 


GAT 


ala gly 


his 


arg 


ser 


val 




61/21 












GCA GTG 

wvfl w A W 


ACG 


ACA 


CCA 


GCG 


CAG 


ala val 


thr 


thr 


pro 


ala 


gin 


121/41 












GGC TCG 


CCT 


TTT 


TTT 


CAT 


CAA 


gly ser 


pro 


phe 


phe his 


gin 


181/61 












TTC GGT 


CAC 


CTG 


ACG 


GTC 


GGG 


phe gly 


his 


leu 


thr 


val 


gly 


241/81 












TGC CCT 


GCT 


GGT 


GCG 


GCG 


TTC 


cys pro 


ala 


gly 


ala 


ala 


phe 


301/101 












GTC GAT 


GGC 


CCT 


CAA 


CTC 


GGC 


val asp 


gly 


pro 


gin 

• 


leu 


gly 


CGG GCC 


ACC 


GAT 


CAG 


TCG 


ATC 


arg ala 


thr 


asp 


gin 


ser 


ile 


62/21 












CAG TGA 


CGA 


CAC 


CAG 


CGC 


AGG 


gin OPA 


ara 


his 


gin 


arg 


ara 


122/41 












GCT CGC 


CTT 


TTT 


TTC 


ATC 


AAC 


ala arg 


leu 


phe 


phe 


ile 


asn 


182/61 












TCG GTC 


ACC 


TGA 


CGG 


TCG 


GGA 


ser val 


thr 


OPA 


arg 


ser 


gly 


242/81 










GCC CTG 


CTG 


GTG 


CGG 


CGT 


TCG 


ala leu 


leu 


val 


arg 


arg 


ser 


302/101 












TCG ATG 


GCC 


CTC 


AAC 


TCG 


GCA 


ser met 


ala 


leu 


asn 


ser 


ala 



58/185 



31/11 

CGG GTG GTT TCC GCT CCA 
arg val val ser ala pro 
91/31 

GAC GCG CCG TTG GTG TTT 
asp ala pro leu val phe 
151/51 

CGT TGG ACT GCC GCA GTG 
arg trp thr ala ala val 
211/71 

ATG TTC CTT GGG TCT CGG 
met phe leu gly ser arg 

271/91 
GGC CGA GTC GAT CAC CGC 
gly arg val asp his arg 

331/111 
ATC GCG ACT GGC GAT TAT 
ile ala thr gly asp tyr 

SEQ ID N° 17A 
FIGURE 17A 







32/11 




GGG TGG 


TTT 


CCG CTC 


CAT 


gly trp 


phe 


pro leu 


his 






92/31 




ACG CGC 


CGT 


TGG TGT 


TTC 


thr arg 


arg 


trp cys 


phe 






152/51 




GTT GGA 


CTG 


CCG CAG 


TGG 


val gly 


leu 


pro gin 


trp 






212/71 




TGT TCC 


TTG 


GGT CTC 


GGG 


cys ser 


leu 


gly leu 


gly 






272/91 




GCC GAG 


TCG 


ATC ACC 


GCC 


ala glu 


ser 


ile thr 


ala 






332/111 




TCG CGA 


CTG 


GCG ATT 


ATC 


ser arg 


leu 


ala ile 


ile 



SEQ ID N° 17B 
FIGURE 17B 



TCA 
ser 


GCC 
ala 


CGG AAT 
arg asn 


TGA 
OPA 


GGT GCC 
gly ala 


CCC 
pro 


TCT 
ser 


GTT 
val 


GCT 
ala 


TTC 

phe 


CCG 
pro 


TCC 
ser 


GCG 
ala 


ATG 
met 


TTG 
leu 


GTC 
val 


GCC 
ala 


GGC GTG 
gly val 


GTT 
val 


GCT 
ala 


GCT GGG 
ala gly 


TTT 
phe 


GCT CAA 
ala gin 


CAA AGA 
gin arg 


GCA 
ala 


CCC 
pro 


GTT 
val 


AAA ACG 
lys thr 


CAC 
his 


CAT 
his 


GCC 
ala 


TCG 
ser 


GGC 
gly 


TGA 
OPA 


TC 


CAG CCC 
gin pro 


GGA ATT 
gly ile 


GAG 
glu 


GTG 
val 


CCG 
pro 


CCT 
pro 


CTG 
leu 


TTG 
leu 


CTT 
leu 


TCC 
ser 


CGT 
arg 


CCG 
pro 


CGA 
arg 


TGT 
cys 


TGG 
trp 


TCG 
ser 


CCG 
pro 


GCG 
ala 


TGT 
cys 


TTG 
leu 


CTG 
leu 


CTG GGT 
leu gly 


TTG 
leu 


CTC 
leu 


AAT 
asn 


AAA 
lys 


GAG 
glu 


CAC 
his 


CCG 
pro 


TTA 
leu 


AAA 
lys 


CGG 
arg 


ACC 
thr 


ATG 
met 


CCT 
pro 


CGG 
arg 


GCT 
ala 


GAT 
asp 


c 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



59/185 

















33/11 
















GGG CCA 


CCG 


ATC 


AGT 


CGA TCG 


GGT GGT 


TTC 


CGC TCC 




CCG 


GAA 


lib 


AGG 


TGC 


CGC 


g±y pro 


pro 


ile 


ser 


arg ser 


gly gly 


phe 


arg ser 


He ser 


pro glu 


leu 


arg 


cys 


arg 


63/21 














93/31 










AGT GAC 


GAC 


ACC 


AGC 


GCA GGA 


CGC GCC 


x x 


GGT GTT 


TCC CTC 


TGT 




TTT 


CCC 


GTC 


CGG 


oar 3k c r\ 


CIS p 


rhr 


ser 


ala gly arg ala 


Val 


gly val 


ser leu 


cys 


cys 


phe 


pro 


val 


arg 


123/41 














153/51 








CTC GCC 


TTT 


TTT 


TCA 


TCA ACG 


TTG GAC 


TGC 


CGC AGT 


GGC GAT 


GTT 


GGT 


CGC 


CGG 


CGT 


GTT 


leu ala 


phe 


phe 


ser 


ser thr 


leu asp 


cys 


arg ser 


gly asp 


val 


gly 


arg 


arg 


arg 


val 


183/61 














213/71 








CGG TCA 


CCT 


GAC 


GGT 


CGG GAT 


GTT CCT 


TGG 


GTC TCG 


GGT TGC 


TGC 


TGG 


GTT 


TGC TCA ATG 


arg ser 


pro 


asp 


gly arg asp val pro 


trp 


val ser 


gly cys 


cys 


trp 


val 


cys 


ser 


met 


243/81 














273/91 












CCC TGC 


TGG 


TGC 


GGC 


GTT CGG 


CCG AGT 


CGA 


TCA CCG 


CCA AAG 


AGC 


ACC 


CGT 


TAA AAC 


GGT 


pro cys 


trp 


cys 


gly val arg 


pro ser 


arg 


ser pro pro lys 


ser 


thr 


arg 


OCH 


asn 


gly 


303/101 














333/111 












CGA TGG 


CCC 


TCA 


ACT 


CGG CAT 


CGC GAC 


TGG 


CGA TTA 


TCA CCA 


TGC 


CTC 


GGG 


CTG 


ATC 




arg trp 


pro 


ser 


thr 


arg his 


arg asp 


trp 


arg leu 


ser pro 


cys 


leu 


gly 


leu 


ile 





SEQ ID N° 17C 
FIGURE 17C 



partie de la sequence nucleotidique de seq!7A 



1/1 


















31/11 














ggc tag 
gly AMB 
61/21 


aac 
asn 


CCC 

pro 


gaa 
glu 


gga 
gly 


gac 
asp 


etc 
leu 


gcg 
ala 


ggt 
gly 


tgc egg 
cys arg 
91/31 


ccc ccg 
pro pro 


gec 
ala 


cat 
his 


egg 
arg 


atg cgt 
met arg 


ate 
ile 


egg teg 
arg ser 
121/41 


cgc 
arg 


cga 
arg 


ttc 
phe 


acg 
thr 


ace 
thr 


gac 
asp 


ata 
ile 


ggg 

gly 


age cac 
ser tyr 
151/51 


ccc ttg ggt 
pro leu gly 


gat 
asp 


tec 
ser 


ggt gcg 
gly ala 


acg 
thr 


act gcg 
thr ala 
181/61 


ata 
ile 


cgc 
arg 


teg 
ser 


gcg 
ala 


ggc 
gly 


cac 
his 


cga 
arg 


tea 
ser 


gtc gat 
val asp 
211/71* 


egg gtg 
arg val 


gtt 
val 


tec 
ser 


get 
ala 


cca tea 
pro ser 


gee 
ala 


egg aat 
arg asn 
241/81 


tga 
OPA 


ggt 
gly 


gec 
ala 


gca 
ala 


gtg 
val 


acg 
thr 


aca 
thr 


cca 
pro 


gcg cag 
ala gin 
271/91 


gac gcg 
asp ala 


ccg 
pro 


ttg 
leu 


gtg 
val 


ttt ccc 
phe pro 


tct 
ser 


gtt get 
val ala 
301/101 


ttc 
phe 


cgt 
arg 


ccg 
pro 


gtt 
val 


cgc 
arg 


ctt 
leu 


ttt 
phe 


ttc 
phe 


ate aac 
ile asn 
331/111 


gtt gga 
val gly 


ctg 
leu 


gee 
ala 


gca 
ala 


gtg gcg 
val ala 


atg 
met 


ttg gtc 
leu val 
361/121 


gee 
ala 


ggc 
gly 


gtg 
val 


ttc 
phe 


ggt 
gly 


cac 
his 


ctg 
leu 


acg 
thr 


gtc ggg 
val gly 
391/131 


atg ttc ttg ggt 
met phe leu gly 


etc 
leu 


ggg ttg 
gly leu 


ctg 
leu 


ctg ggt 
leu gly 
421/141 


ttg 
leu 


etc 
leu 


aat 
asn 


gee 
ala 


ctg 
leu 


ctg 
leu 


gtg 
val 


egg 
arg 


cgt teg 
arg ser 
451/151 


gee gag 
ala glu 


teg 
ser 


ate 
ile 


ace 
thr 


gee aaa gag 
ala lys glu 


cac ccg 
his pro 
481/161 


tta 
leu 


aaa 
lys 


egg 
arg 


teg 
ser 


atg 
met 


gee 
ala 


etc 
leu 


aac 
asn 


teg gca 
ser ala 


teg cga 
ser arg 


ctg 
leu 


gcg 
ala 


att 
ile 


ate ace 
ile thr 


ate 
ile 


etc ggg 
leu gly 


ctg 
leu 


ate 
ile 





























SEQ ID N° 17A' 



FEUILLE DE REMpffilfflEtfft'REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



60/185 



1/1 31/11 

get aga ace ccg aag gag ace teg egg gtt gee ggc ccc egg ccc ate gga tgc gta tec 

ala arg thr pro lys glu thr ser arg val ala gly pro arg pro ile gly cys val ser 

61/21 91/31 

ggt cgc gee gat tea cga ccg aca tag gga get ace cct tgg gtg att ccg gtg cga cga 

gly arg ala asp ser arg pro thr AMB gly ala thr pro trp val ile pro val arg arq 

121/41 151/51 

ctg cga tac get egg egg gee ace gat cag teg ate ggg tgg ttt ccg etc cat cag ccc 

leu arg tyr ala arg arg ala thr asp gin ser ile gly trp phe pro leu his gin pro 

181/61 211/71 

gga att gag gtg ccg cag tga cga cac cag cgc agg acg cgc cgt tgg tgt ttc cct ctg 

gly ile glu val pro gin OPA arg his gin arg arg thr arg arg trp cys phe pro leu 

241/81 271/91 

ttg ctt tec gtc egg ttc gee ttt ttt tea tea acg ttg gac tgg ccg cag tgg cga tgt 

leu leu ser val arg phe ala phe phe ser ser thr leu asp trp pro gin trp arg cys 

301/101 331/111 

tgg teg ccg gcg tgt teg gtc acc tga egg teg gga tgt tct tgg gtc teg ggt tgc tgc 

trp ser pro ala cys ser val thr OPA arg ser gly cys ser trp val ser gly cys cys 

361/121 391/131 

tgg gtt tgc tea atg ccc tgc tgg tgc ggc gtt egg ccg agt cga tea ccg cca aag age 

trp val cys ser met pro cys trp cys gly val arg pro ser arg ser pro pro lys ser 

421/141 451/151 

acc cgt taa aac ggt cga tgg ccc tea act egg cat cgc gac tgg cga tta tea cca tec 

thr arg OCH asn gly arg trp pro ser thr arg his arg asp trp arg leu ser pro ser 
481/161 

teg ggc tga tc 
ser gly OPA 



SEQ ID N° 17B' 
FIGURE 17B' 



1/1 






eta gaa 


ccc 


cga 


leu glu 


pro 


arg 


61/21 






gtc gcg 


ccg 


att 


val ala 


pro 


ile 


121/41 






tgc gat 


acg 


etc 


cys asp 


thr 


leu 


181/61 






gaa ttg 


agg 


tgc 


glu leu 


arg 


cys 


241/81 






tgc ttt 


ccg 


tec 


cys phe 


pro 


ser 


301/101 






ggt cgc 


egg 


cgt 


gly arg 


arg 


arg 


361/121 






ggg ttt 


get 


caa 


gly phe 


ala gin 


421/141 






ccc gtt 


aaa 


acg 


pro val 


lys 


thr 


491/161 






egg get 


gat 


c 


arg ala 


asp 





agg aga cct cgc 
arg arg pro arg 

cac gac cga cat 
his asp arg his 

ggc ggg cca ccg 
gly gly pro pro 

cgc agt gac gac 
arg ser asp asp 

ggt teg cct ttt 
gly ser pro phe 

gtt egg tea cct 
val arg ser pro 

tgc cct get ggt 
cys pro ala gly 

gtc gat ggc cct 
val asp gly pro 



31/11 



ggg 


ttg ccg gee 


giy 


leu 


pro ala 






,91/31 


agg 


gag 


eta ccc 


arg 


glu 


leu pro 






151/51 


ate 


agt 


cga teg 


ile 


ser 


arg ser 






211/71 


ace 


age 


gca gga 


thr 


ser 


ala gly 






271/91 


ttt 


cat 


caa cgt 


phe 


his 


gin arg 






331/111 


gac 


ggt 


egg gat 


asp 


gly 


arg asp 






391/131 


gcg 


gcg 


ttc ggc 


ala 


ala 


phe gly 






451/151 


caa 


etc 


ggc ate 


gin 


leu 


gly ile 



ccc ggc cca teg 
pro gly pro ser 

ctt ggg tga ttc 
leu gly OPA phe 

ggt ggt ttc cgc 
gly gly phe arg 

cgc gee gtt ggt 
arg ala val gly 

tgg act ggc cgc 
trp thr gly arg 

gtt ctt ggg tct 
val leu gly aer 

cga gtc gat cac 
arg val asp his 

gcg act ggc gat 
ala thr gly a3p 



gat 
asp 


gcg 
ala 


tat 
tyr 


ccg 
pro 


egg 
arg 


tgc 
cys 


gac 
asp 


gac 
asp 


tec 
ser 


ate 
ile 


age 
ser 


ccg 
pro 


gtt 
val 


tec 
ser 


etc 
leu 


tgt 
cys 


agt 
ser 


ggc gat 
gly asp 


gtt 
val 


egg 
arg 


gtt 
val 


get 
ala 


get 
ala 


cgc caa aga 
arg gin arg 


gca 
ala 


tat 
tyr 


cac 
his 


cat 
his 


cct 
pro 



SEQ ID N° 17C* 



FEUILLE DE REMPkAfi6MBNE (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



61/185 

sequence Rvl303 predite par Cole et al. (Nature 393:537-544) et contenant partiellement 
SeqllA* 

1/1 31/11 

atg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct gtt get ttc cgt ccg gtt 
met thr thr pro ala gin asp ala pro leu val phe pro ser val ala phe arg pro val 
61/21 91/31 

cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ttg gtc gec ggc gtg ttc 
arg leu phe phe ile asn val gly leu ala ala val ala met leu val ala gly val phe 
121/41 151/51 

ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg ggt ttg etc aat gee 
gly his leu thr val gly met phe leu gly leu gly leu leu leu gly leu leu asn ala 
181/61 211/71 

ctg ctg gtg egg cgt teg gec gag teg ate acc gec aaa gag cac ccg tta aaa egg teg 
leu leu val arg arg ser ala glu ser ile thr ala lys glu his pro leu lys aro ser 
241/81 271/91 

atg gee etc aac teg gca teg cga ctg gcg att ate acc ate etc ggg ctg ate ate gec 
met ala leu asn ser ala ser arg leu ala ile ile thr ile leu gly leu ile ile ala 
301/101 331/111 

tac att ttc egg ccc get gga ttg ggc gtc gtg ttc ggg ctg gca ttc ttc cag gtg ctg 
tyr ile phe arg pro ala gly leu gly val val phe gly leu ala phe phe gin val leu 
361/121 391/131 

ctg gtg gca acg acg gee ctg ccg gtc ctg aag aag ctg cgc act gcg acc gag gaa ccg 
leu val ala thr thr ala leu pro val leu lys lys leu arg thr ala thr glu glu pro 
421/141 451/151 

gtc gca act tat tct tec aat ggc cag acc ggg gga teg gaa gga agg age gee age gat 
val ala thr tyr ser ser asn gly gin thr gly gly ser glu gly arg ser ala ser asp 
481/161 
gac tga 
asp OPA 

SEQ ID N° 17D 
FIGURE 17D 



Orf d'apres Cole et al. (Nature 393:537- 
1/! 

tga ggt gee gca gtg acg aca cca gcg cag 
OPA gly ala ala val thr thr pro ala gin 
61/21 

ttc cgt ccg gtt cgc ctt ttt ttc ate aac 
phe arg pro val arg leu phe phe ile asn 
121/41 

gec ggc gtg ttc ggt cac ctg acg gtc ggg 
ala gly val phe gly his leu thr val gly 
181/61 

ttg etc aat gee ctg ctg gtg egg cgt teg 
leu leu asn ala leu leu val arg arg ser 
241/81 

tta aaa egg teg atg gee etc aac teg gca 
leu lys arg ser met ala leu asn ser ala 
301/101 

ctg ate ate gee tac. att ttc egg ccc get 
leu ile ile ala tyr ile phe arg pro ala 
361/121 

ttc cag gtg ctg ctg gtg gca acg acg gec 
phe gin val leu leu val ala thr thr ala 
421/141 

acc gag gaa ccg gtc gca act tat tct tec 
thr glu glu pro val ala thr tyr 3er ser 
481/161 

age gee age gat gac tga 
ser ala ser asp asp OPA 



•544) et 


contenant Rvl303 








31/11 
















gac gcg 


ccg 


ttg 


gtg ttt 


ccc 


tct 


gtt 


get 


asp ala 


pro 


leu 


val phe 


pro 


ser 


val 


ala 


91/31 












gtt gga 


ctg 


gee 


gca gtg 


gcg 


atg 


ttg 


gtc 


val gly 


leu 


ala 


ala val 


ala 


met 


leu 


val 


151/51 














atg ttc 


ttg 


ggt 


etc ggg 


ttg 


ctg 


ctg 


ggt 


met phe 


leu 


gly 


leu gly 


leu 


leu 


leu 


gly 


211/71 












gee gag 


teg 


ate 


acc gee 


aaa 


gag 


cac 


ccg 


ala glu 


ser 


ile 


thr ala 


lys 


glu 


his 


pro 


271/91 












teg cga 


ctg 


gcg 


att ate 


acc 


ate 


etc 


ggg 


ser arg 


leu 


ala 


ile ile 


thr 


ile 


leu 


gly 


331/111 














gga ttg 


ggc 


gtc 


gtg ttc 


ggg 


ctg 


gca 


ttc 


gly leu 


gly 


val 


val phe 


gly 


leu 


ala 


phe 


391/131 












ctg ccg 


gtc 


ctg 


aag aag 


ctg 


cgc 


act 


gcg 


leu pro 


val 


leu 


lys lys 


leu 


arg 


thr 


ala 


451/151 














aat ggc 


cag 


acc 


ggg gga 


teg 


gaa 


gga 


agg 


asn gly 


gin 


thr 


gly gly 


ser 


glu 


gly 


arg 



ID N° 17F 



FEUILLE DE REMH<XGBMENT(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



62/185 



31/11 

GTC GAA CAG GTA CGG AAG GCG CCG TCG GTC GCT CGG TCC GCT GGT ATC TCG TGT TCA GCC 
val glu gin val arg lys ala pro ser val ala arg ser ala gly ile ser cys ser ala 
61/21 91/31 

AGC CAG CGG CCG TTA ACG TGG CCG AAC AGG TCG TCT TGG GGT CGG GCA TCA GCG TCG ATG 
ser gin arg pro leu thr trp pro asn arg ser ser trp gly arg ala ser ala ser met 
121/41 151/51 

TGG CTC AGG TCG ATA CCC GAG GGG ATG GCA AGT GTC ACC CCG CCA TCC TTC CAC CTC TTT 
trp leu arg ser ile pro glu gly met ala ser val thr pro pro ser phe his leu phe 
181/61 211/71 

TCG GGT GCA ACG ATC GGG CCA TGC CTG ACG GGG AGC AGA GCC AGC CAC CGG CCC AAG AAG 
ser gly ala thr ile gly pro cys leu thr gly ser arg ala ser his arg pro Ivs lvs 
241/81 271/91 

ATG CGG AAG ACG ACT CGC GGC CCG ACG CCG CGG AGG CCG CCG CGG CCG AAC CCA AAT CAT 
met arg lys thr thr arg gly pro thr pro arg arg pro pro arg pro asn pro asn his 
301/101 331/111 

CAG CCG GTC CCG ATG TTC TCG ACC TAC GGT ATC GCC TCG ACA CTA CTC GGC GTG CTA TCG 
gin pro val pro met phe ser thr tyr gly ile ala ser thr leu leu gly val leu ser 
361/121 

GTC GCC GCG GTC GTG CTG GGT GCG ATG ATC 
val ala ala val val leu gly ala met ile 



SEQ ID N° 18A 
FIGURE 18A 



TCG AAC 


AGG 


TAC 


GGA 


ser asn 


arg 


tyr 


gly 


62/21 








GCC AGC 


GGC 


CGT 


TAA 


ala ser 


gly 


arg 


OCH 


122/41 








GGC TCA 


GGT 


CGA 


TAC 


gly ser 


gly 


arg 


tyr 


182/61 








CGG GTG 


CAA 


CGA 


TCG 


arg val 


gin 


arg 


ser 


242/81 








TGC GGA 


AGA 


CGA 


CTC 


cys gly 


arg 


arg 


leu 


302/101 








AGC CGG 


TCC 


CGA 


TGT 


ser arg 


ser 


arg 


cys 


362/121 








TCG CCG 


CGG 


TCG 


TGC 


ser pro 


arg 


ser 


cys 



AGG CGC CGT CGG TCG 
arg arg arg arg ser 

CGT GGC CGA ACA GGT 
arg gly arg thr gly 

CCG AGG GGA TGG CAA 
pro arg gly trp gin 

GGC CAT GCC TGA CGG 
gly his ala OPA arg 

GCG GCC CGA CGC CGC 
ala ala arg arg arg 

TCT CGA CCT ACG GTA 
ser arg pro thr val 

TGG GTG CGA TGA TC 
trp val arg OPA 



32/11 

CTC GGT CCG CTG GTA 
leu gly pro leu val 
92/31 

CGT CTT GGG GTC GGG 
arg leu gly val gly 
152/51 

GTG TCA CCC CGC CAT 
val ser pro arg his 
212/71 

GGA GCA GAG CCA GCC 
gly ala glu pro ala 
272/91 

GGA GGC CGC CGC GGC 
gly gly arg arg gly 
332/111 

TCG CCT CGA CAC TAC 
ser pro arg his tyr 



TCT 


CGT 


GTT 


CAG 


CCA 


ser 


arg 


val 


gin 


pro 


CAT 


CAG 


CGT 


CGA 


TGT 


his 


gin 


arg 


arg 


cys 


CCT 


TCC 


ACC 


TCT 


TTT 


pro 


ser 


thr 


ser 


phe 


ACC 


GGC 


CCA 


AGA 


AGA 


thr gly 


pro 


arg 


arg 


CGA 


ACC 


CAA 


ATC 


ATC 


arg 


thr 


gin 


ile 


ile 


TCG 


GCG 


TGC 


TAT 


CGG 


ser 


ala 


cys 


tyr 


arg 



SEQ ID N° 18B 



FIGURE 18B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



63/185 



3/1 












CGA ACA 


GGT 


ACG 


GAA 


GGC 


GCC 


arg thr 




thr 


glu gly ala 


63/21 












CCA GCG 


GCC 


GTT 


AAC 


GTG 


GCC 


nro ala 


ala 


val 


asn 


val 


ala 


123/41 












GCT CAG 


GTC 


GAT 


ACC 


CGA 


GGG 


ala oln 


val 


asp 


thr arg gly 


183/61 












GGG TGC 


AAC 


GAT 


CGG 


GCC 


ATG 


gly cys 


asn 


asp 


arg 


ala 


met 


243/81 












GCG GAA 


GAC 


GAC 


TCG 


CGG 


CCC 


ala glu 


asp 


asp 


ser 


arg 


pro 


303/101 












GCC GGT 


CCC 


GAT 


GTT 


CTC 


GAC 


ala gly 


pro 


asp 


val 


leu 


asp 


363/121 










CGC CGC 


GGT 


CGT 


GCT 


GGG 


TGC 


arg arg 


gly 


arg 


ala gly cys 







33/11 




GTC 




TCG GTC 


CGC 


val 


gly arg 


ser val 


arg 






93/31 




GAA 


cag err 


GTC TTG 


GGG 


n 1 ii 

y ju u 


yxii val 


val leu 


gly 






153/51 




GAT 


GGC AAG 


TGT CAC 


CCC 


asp 


/tl 11 It F t~* 

gxy ±ys 


cys his 


pro 






213/71 




CCT 


GAC GGG 


GAG CAG AGC 


pro 


asp gly 


glu gin 


ser 






273/91 




GAC 


GCC GCG 


GAG GCC 


GCC 


asp 


ala ala 


glu ala 


ala 






333/111 




CTA 


CGG TAT 


CGC CTC 


GAC 


leu 


arg tyr 


arg leu 


asp 


GAT 


GAT C 






asp 


asp 







SEQ ID N° 18C 
FIGURE 18C 



TGG 


TAT 


CTC 


GTG 


TTC 


AGC 


CAG 


trp 


tyr 


leu 


val 


phe 


ser 


gin 


TCG 


GGC 


ATC 


AGC 


GTC 


GAT 


GTG 


ser 




ile 


ser 


vax 


asp 


vai 


GCC 


ATC 


CTT 


CCA 


CCT 


CTT 


TTC 


ala 


ile 


leu 


pro 


pro 


leu 


phe 


CAG 


CCA 


CCG 


GCC 


CAA 


GAA 


GAT 


gin 


pro 


pro 


ala 


gin 


glu 


asp 


GCG 


GCC 


GAA CCC 


AAA 


TCA 


TCA 


ala 


ala 


glu pro 


lys 


ser 


ser 


ACT 


ACT 


CGG 


CGT 


GCT 


ATC 


GGT 


thr 


thr 


arg 


arg 


ala 


ile 


gly 



partie de la sequence nucleotidique de seqlSA 
1/1 31/11 

GAA GGC GCC GTC GGT CGC TCG GTC CGC TGG TAT CTC GTG TTC AGC CAG CCA GCG GCC GTT 
glu gly ala val gly arg ser val arg trp tyr leu val phe ser gin pro ala ala val 
61/21 91/31 

AAC GTG GCC GAA CAG GTC GTC TTG GGG TCG GGC ATC AGC GTC GAT GTG GCT CAG GTC GAT 
asn val ala glu gin val val leu gly ser gly ile ser val asp val ala gin val asp 
121/41 151/51 

ACC CGA GGG GAT GGC AAG TGT CAC CCC GCC ATC CTT CCA CCT CTT TTC GGG TGC AAC GAT 
thr arg gly asp gly lys cys his pro ala ile leu pro pro leu phe gly cys asn aso 
181/61 211/71 

CGG GCC ATG CCT GAC GGG GAG CAG AGC CAG CCA CCG GCC CAA GAA GAT GCG GAA GAC GAC 
arg ala met pro asp gly glu gin ser gin pro pro ala gin glu asp ala glu asp aso 
241/81 271/91 

TCG CGG CCC GAC GCC GCG GAG GCC GCC GCG GCC GAA CCC AAA TCA TCA GCC GGT CCG ATG 
ser arg pro asp ala ala glu ala ala ala ala glu pro lys ser ser ala gly pro met 
301/101 331/111 

TTC TCG ACC TAC GGT ATC GCC TCG ACA CTA CTC GGC GTG CTA TCG GTC GCC GCG GTC GTG 
phe ser thr tyr gly ile ala ser thr leu leu gly val leu ser val ala ala val val 
361/121 

CTG GGT GCG ATG ATC 
leu gly ala met ile 



SEQ ID N° 18A' 
FIGURE 18A» 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



64/185 



1/1 

CGG AAG GCG CCG TCG GTC GCT 
arg lys ala pro ser val ala 
61/21 

TTA ACG TGG CCG AAC AGG TCG 
leu thr trp pro asn arg ser 
121/41 

ATA CCC GAG GGG ATG GCA AGT 
ile pro glu gly met ala ser 
181/61 

ATC GGG CCA TGC CTG ACG GGG 
ile gly pro cys leu thr gly 
241/81 

ACT CGC GGC CCG ACG CCG CGG 
thr arg gly pro thr pro arg 
301/101 

TGT TCT CGA CCT ACG GTA TCG 
cys ser arg pro thr val ser 
361/121 

TGC TGG GTG CGA TGA TC 
cys trp val arg OPA 









31/11 




CGG 


TCC 


GCT 


GGT ATC 


TCG 


arg 


ser 


ala 


gly ile 


ser 








91/31 




TCT 


TGG 


GGT 


CGG GCA TCA 


ser 


trp 


alv 


arg ala 


ser 








151/51 




GTC 


ACC 


CCG 


CCA TCC 


TTC 


val 


thr 


pro 


pro ser 


phe 








211/71 




AGC 


AGA 


GCC 


AGC CAC 


CGG 


ser 


arg 


ala 


ser his 


arg 








271/91 


AGG 


CCG 


CCG 


CGG CCG 


AAC 


arg 


pro 


pro 


arg pro 


asn 








331/111 




CCT 


CGA 


CAC 


TAC TCG 


GCG 


pro 


arg 


his 


tyr ser 


ala 



SEQ ID N° 18B' 
FIGURE 18B' 



TGT 


TCA 


GCC 


AGC 


CAG 


CGG 


CCG 


cys 


ser 


ala 


ser 


gin 


arg 


pro 


GCG 


TCG 


ATG 


TGG 


CTC 


AGG 


TCG 


ala 


ser 


met 


trp 


leu 


a rg 


ser 


CAC 


CTC 


TTT 


TCG 


GGT 


GCA 


ACG 


his 


leu phe 


ser 


gly 


ala 


thr 


CCC 


AAG 


AAG 


ATG 


CGG 


AAG 


ACG 


pro lys 


lys met 


arg 


lys 


thr 


CCA 


AAT 


CAT 


CAG 


CCG 


GTC 


CGA 


pro 


asn 


his 


gin 


pro 


val 


arg 


TGC 


TAT 


CGG 


TCG 


CCG 


CGG 


TCG 


cys 


tyr 


arg 


ser 


pro 


arg 


ser 



31/11 

GGA AGG CGC CGT CGG TCG CTC GGT CCG CTG GTA TCT 
gly arg arg arg arg ser leu gly pro leu val ser 
61/21 91/31 
TAA CGT GGC CGA ACA GGT CGT CTT GGG GTC GGG CAT 
OCH arg gly arg thr gly arg leu gly val gly his 
121/41 151/51 
TAC CCG AGG GGA TGG CAA GTG TCA CCC CGC CAT CCT 
tyr pro arg gly trp gin val ser pro arg his pro 
181/61 • 211/71 

TCG GGC CAT GCC TGA CGG GGA GCA GAG CCA GCC ACC 
ser gly his ala OPA arg gly ala glu pro ala thr 
241/81 271/91 
CTC GCG GCC CGA CGC CGC GGA GGC CGC CGC GGC CGA 
leu ala ala arg arg arg gly gly arg arg gly arg 
301/101 331/111 
GTT CTC GAC CTA CGG TAT CGC CTC GAC ACT ACT CGG 
val leu asp leu arg tyr arg leu asp thr thr arg 
361/121 

GCT GGG TGC GAT GAT C 
ala gly cys asp asp 



GTT 
val 


CAG 
gin 


CCA GCC 
pro ala 


AGC 
ser 


GGC 
gly 


CGT 
arg 


CGT 


CGA 


TGT GGC 


TCA 


GGT 


CGA 


arg 


arg cys gly 


ser 


gly 


arg 


ACC 
thr 


TCT TTT CGG 
ser phe arg 


GTG 
val 


CAA 
gin 


CGA 
arg 


CCA 


AGA 


AGA TGC 


GGA 


AGA 


CGA 


pro 


arg 


arg cys 


gly 


arg 


arg 


CAA ATC 
gin ile 


ATC AGC 
ile ser 


CGG 
arg 


TCC 
ser 


GAT 
asp 


GCT 
ala 


ATC 
ile 


GGT CGC 
gly arg 


CGC 
arg 


GGT 
gly 


CGT 
arg 



SEQ ID N° 18C 
FIGURE 18C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

65/185 

sequence Rv0199 predite par Cole et al. (Nature 393;537-544) et contenant 
seql8A' 

1/1 * 31/11 

gcc caa 
ala gin 
91/31 
ccc aaa 
pro lys 
151/51 
gtg eta 
val leu 
211/71 
tec ggc 
ser gly 
271/91 
ctg ate 
leu ile 
331/111 
gtc ggt 
val gly 
391/131 
aag ttg 
lys leu 
451/151 
gag ctg 
glu leu 
511/171 
gcc act 
ala thr 
571/191 
aaa ccc 
lys pro 
631/211 



atg cct 
Met pro 
61/21 


gac 
asp 


ggg 

gly 


gag 
glu 


cag 
gin 


age 
ser 


cag 
gin 


cca 
pro 


ccg 
pro 


ccc gac 
pro asp 
121/41 


gcc 
ala 


gcg 
ala 


gag 
glu 


gcc 
ala 


gcc 
ala 


gcg 
ala 


gcc 
ala 


gaa 
glu 


acc tac 
thr tyr 
181/61 


ggt 
gly 


ate 
ile 


gcc 
ala 


teg 
ser 


aca 
thr 


eta 
leu 


etc 
leu 


ggc 

giy 


gcg atg 
ala met 
241/81 


ate 
ile 


tgg 
trp 


tec 
ser 


gca 
ala 


cac 
his 


cgc 
arg 


gat 
asp 


gac 
asp 


atg ctg 
met leu 
301/101 


acc 
thr 


gcc 
ala 


get 
ala 


gaa 
glu 


tgg 
trp 


acg 
thr 


gcc 
ala 


gtg 
val 


gcc age 
ala ser 
361/121 


ctg 
leu 


cag 
gin 


cga 
arg 


ctg 
leu 


cac 
his 


gac 
asp 


gga 
gly 


acg 
thr 


gtc gtg 
val val 
421/141 


cag 
gin 


ccc 
pro 


tac 
tyr 


egg 
arg 


cag 
gin 


gtg 
val 


gtg 
val 


gag 
glu 


gag gcg 
glu ala 
481/161 


gta 
val 


gcg 
ala 


ate 
ile 


gat 
asp 


acg 
thr 


gtg 
val 


cac 
his 


cgc 
arg 


ccg gta 
pro val 
541/181 


gta 
val 


acc 
thr 


acg 
thr 


aaa 
lys 


ttg 
leu 


cca 
pro 


ccg 
pro 


ttt 
phe 


gcg acg 
ala thr 
601/201 


teg 
ser 


gtc 
val 


agt 
ser 


gag 
glu 


aac 
asn 


gcc 
ala 


ggc 

gly 


gcc 
ala 


etc gat 
leu asp 


gtc 
val 


tec 
ser 


gat 
asp 


gtg 
val 


gac 
asp 


ggc 

gly 


aag 
lys 


ctg 
leu 



gaa 
glu 


gat 
asp 


gcg 
ala 


gaa 
glu 


gac 
asp 


gac 
asp 


teg 
ser 


egg 
arg 


tea 
ser 


tea 
ser 


gcc 
ala 


ggt 
gly 


ccg 
pro 


atg 
met 


ttc 
phe 


teg 
ser 


teg 
ser 


gtc 
val 


gcc 
ala 


gcg 
ala 


gtc 
val 


gtg 
val 


ctg 
leu 


ggt 
gly 


gag 
glu 


cgt 
arg 


acc 
thr 


tac 
tyr 


ctg 
leu 


acc 
thr 


egg 
arg 


gtc 
val 


aac 
asn 


atg 
met 


aac 
asn 


gcc 
ala 


gac 
asp 


aac 
asn 


ate 
ile 


gat 
asp 


caa 
gin 


etc 
leu 


aac 
asn 


acc 

rh r 


gac 
asp 


ttc 
phe 


gac 
asp 


get 
ala 


egg 
arg 


acg 
thr 


cac 
his 


age 
ser 


age 
ser 


ggc 

giy 


agg 
arg 


ate 
ile 


gat 
asp 


acc 
thr 


cag 
gin 


tec 
ser 


ggt 
gly 


gcc 
ala 


gcc 
ala 


cga 
arg 


cgc 
arg 


acc 
thr 


gac 
asp 


teg 
ser 


gtg 
val 


ctg 
leu 


ctg 
leu 


gtc 
val 


cag 
gin 


acc 
thr 


gtg 
val 


cac 
his 


tgg 
trp 


aac 
asn 


ttg 
leu 


egg 
arg 


tec 
ser 


egg 
arg 


ttg 
leu 


gag 
glu 


teg 
ser 


att 
ile 


cga 
arg 


tga 
OPA 



SEQ ID N° 18D 
FIGURE 18D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



66/185 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0199 
1/1 31/11 

taa tec gat gcc gga ttg ggt gaa atg cac caa gta acg ggt cga gtc ttt gga ate ggt 
OCH ser asp ala gly leu gly glu met his gin val thr gly arg val phe gly ile olv 
61/21 91/31 9 Y 

ate gac ata gac tec gat gcc gcc gcc cac gcc ggc acg ttg cag agt gcc aag ggc ggc 
ile asp ile asp ser asp ala ala ala his ala gly thr leu gin ser ala lys glv alv 
121/41 151/51 ^ 

ggc caa ttc ggt ggc gtc ggc cgc get gtc aat cgt ggc caa ttc gtc gtg cag egg ttg 
gly gin phe gly gly val gly arg ala val asn arg gly gin phe val val gin arg leu 
181/61 211/71 

cac ccc tgc gcg etc gac ggc ttc etc gtc gag gaa get ggc gta gag gtc gcc gat gcg 
his pro cys ala leu asp gly phe leu val glu glu ala gly val glu val ala asp ala 
241/81 271/91 

ctg cgc ate ggt gcc tac cgc age acc tgc ttg get ggc ctg gat gat cag gtc teg cac 
leu arg ile gly ala tyr arg ser thr cys leu ala gly leu asp asp gin val ser his 
301/101 331/111 

ttg tgt etc ggc gcg gtc gaa cag get acg gaa ggc gcc gtc ggt cgc teg gtc cgc tgg 
leu cys leu gly ala val glu gin ala thr glu gly ala val gly arg ser val arg trp 
361/121 391/131 

tat etc gtg ttc age cag cca gcg gcc gtt aac gtg gcc gaa cag gtc gtc ttg ggg teg 
tyr leu val phe ser gin pro ala ala val asn val ala glu gin val val leu gly ser 
421/141 451/151 

ggc ate age gtc gat gtg get cag gtc gat acc cga ggg gat ggc aag tgt cac ccc gcc 
gly ile ser val asp val ala gin val asp thr arg gly asp gly lys cys his pro ala 
481/161 511/171 

ate ctt cca cct ctt ttc ggg tgc aac gat egg gcc atg cct gac ggg gag cag age cag 
ile leu pro pro leu phe gly cys asn asp arg ala met pro asp gly glu gin ser gin 
541/181 571/191 

cca ccg gcc caa gaa gat gcg gaa gac gac teg egg ccc gac gcc gcg gag gcc gcc gcg 
pro pro ala gin glu asp ala glu asp asp ser arg pro asp ala ala glu ala ala ala 
601/201 631/211 

gcc gaa ccc aaa tea tea gcc ggt ccg atg ttc teg acc tac ggt ate gcc teg aca eta 
ala glu pro lys ser ser ala gly pro met phe ser thr tyr gly ile ala ser thr leu 
661/221 691/231 

etc ggc gtg eta teg gtc gcc gcg gtc gtg ctg ggt gcg atg ate tgg tec gca cac cgc 
leu gly val leu ser val ala ala val val leu gly ala met ile trp ser ala his arg 
721/241 751/251 

gat gac tec ggc gag cgt acc tac ctg acc egg gtc atg ctg acc gcc get gaa tgg acg 
asp asp ser gly glu arg thr tyr leu thr arg val met leu thr ala ala glu trp thr 
781/261 811/271 * 

gcc gtg ctg ate aac atg aac gcc gac aac ate gat gcc age ctg cag cga ctg cac gac 
ala val leu ile asn met asn ala asp asn ile asp ala ser leu gin arg leu his asp 
841/281 871/291 

gga acg gtc ggt caa etc aac acc gac ttc gac get gtc gtg cag ccc tac egg cag gtg 
gly thr val gly gin leu asn thr asp phe asp ala val val gin pro tyr arg gin val 
901/301 931/311 

gtg gag aag ttg egg acg cac age age ggc agg ate gag gcg gta gcg ate gat acg gtg 
val glu lys leu arg thr his ser ser gly arg ile glu ala val ala ile asp thr val 
961/321 • 991/331 

cac cgc gag ctg gat acc cag tec ggt gcc gcc cga ccg gta gta acc acg aaa ttg cca 
his arg glu leu asp thr gin ser gly ala ala arg pro val val thr thr lys leu pro 
1021/341 1051/351 

ccg ttt gcc act cgc acc gac teg gtg ctg ctg gtc gcg acg teg gtc agt gag aac gcc 
pro phe ala thr arg thr asp ser val leu leu val ala thr ser val ser glu asn ala 
1081/361 1111/371 

ggc gcc aaa ccc cag acc gtg cac tgg aac ttg egg etc gat gtc tec gat gtg gac ggc 
gly ala lys pro gin thr val his trp asn leu arg leu asp val ser aso val aso olv 
1141/381 1171/391 * P 9 Y 

aag ctg atg ate tec egg ttg gag teg att cga tga 
lys leu met ile ser arg leu glu ser ile arg OPA 



SEQ ID N° 18F 



FIGURE 18F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



GTT GCG 


CAA 


CGG GGT 


GAG 


CAC 


val ala 


gin 


arg gly 


glu his 


61/21 










CGC CAA 


CGC 


CAA CGA 


CGG 


CAC 


arg gin 


arg 


gin arg 


arg 


his 


121/41 








CTA TGT 


GGT 


AAA CAC 


ACT 


GCG 


leu cys 


gly 


lys his 


thr 


ala 


181/61 










TCG CGT 


GTT 


CAA GGC 


CGA AAA 


ser arg 


val 


gin gly 


arg lys 


241/81 










GGC GCT 


CGA 


GTA CAG 


CCT 


CGG 


gly ala 


arg 


val gin 


pro 


arg 


301/101 








CCC CGC 


CGA 


CGA CAG 


TCC 


GGG 


pro arg 


arg 


arg gin 


ser 


gly 


361/121 








TGC GGT 


GGT 


GCT GGT 


AGA 


TC 


cys gly 


gly 


ala gly 


arg 





67/185 









31/11 




CGA 


CGC 


GAT 


GAT GGC 


GCA 


arg 


arg 


asp 


asD cilv 


did 








91/31 




TCG 


CGC 


GGT 


GGG CAC 


CCC 


ser 


arg gly 


Cfl v h i « 


pro 








151/51 


CAA 


CAG 


CGG 


TTT TGA 


TGT 


gin gin 


arg 


phe OPA 


cys 








211/71 


AGG 


GGT 


GGT 


GAC CCT 


CGG 


arg gly gly 


asp pro 


arg 








271/91 




CAC 


ACC 


GCC 


GGA CGG 


GGT 


his 


thr 


ala 


gly arg 


gly 








331/111 




CTG 


CAG 


TCC 


GTC GGA 


CTA 


leu 


gin 


ser 


val gly 


leu 



SEQ ID N° 19A 
FIGURE 19A 



ACT ATC GAA ACT GCA GGA CAT 
thr ile glu thr ala gly his 

TGG CTA TCA GGC CAG CGT CGA 
trp leu ser gly gin arg arg 

GCA AAC CCC GGA GTT CTC CGC 
ala ash pro gly val leu arg 

CGG CAA CAC CGT GGA GGC GAG 
arg gin his arg gly gly glu 

GAC GGG CCC GCT GGT GGC TGC 
asp gly pro ala gly gly cys 

CGA CAG GCT GCC GGT GTC CGG 
arg gin ala ala gly val arg 



32/11 

TTG CGC AAC GGG GTG AGC ACC GAC GCG ATG ATG GCG CAA CTA TCG AAA CTG CAG GAC ATC 

leu arg asn .gly val ser thr asp ala met met ala gin leu ser lys leu gin asp ile 
62/21 92/31 

GCC AAC GCC AAC GAC GGC ACT CGC GCG GTG GGC ACC CCT GGC TAT CAG GCC AGC GTC GAC 

ala asn ala asn asp gly thr arg ala val gly thr pro gly tyr gin ala ser val asp 

122/41 152/51 F 

TAT GTG GTA AAC ACA CTG CGC AAC AGC GGT TTT GAT GTG CAA ACC CCG GAG TTC TCC GCT 

SE/E ^ " 9 917 PhG aSp Val gln thr ? ro * lu P he «r ala 
182/61 212/71 

CGC GTG TTC AAG GCC GAA AAA GGG GTG GTG ACC CTC GGC GGC AAC ACC GTG GAG GCG AGG 

o^/« al ^ glU lyS gly Val Val thr leu ^ly g^ asn thr val glu ala arg 

242/81 272/91 ~ * 

GCG CTC GAG TAC AGC CTC GGC ACA CCG CCG GAC GGG GTG ACG GGC CCG CTG GTG GCT GCC 

a n a /!n? ^ 9ly thr Pr ° P " aSp gly Val thr 9^ P~ leu val ala ala 
302/101 332/111 

CCC GCC GAC GAC AGT CCG GGC TGC AGT CCG TCG GAC TAC GAC AGG CTG CCG GTG TCC GGT 

362/121 aS?> ^ aSP arg leU Pr ° Val ser ^ 
GCG GTG GTG CTG GTA GAT C 
ala val val leu val asp 



SEQ ID N° 19B 
FIGURE 19B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



68/185 



33/11 



TGC GCA 


ACG 


GGG 


TGA GCA CCG 


cys ala 


thr 


gly 


OPA 


ala 


pro 


63/21 










CCA ACG 


CCA 


ACG 


ACG 


GCA 


CTC 


pro thr 


pro 


thr 


thr 


ala 


leu 


123/41 












ATG TGG 


TAA 


ACA 


CAC 


TGC 


GCA 


met trp 


OCH 


thr 


his 


cys 


ala 


183/61 










GCG TGT 


TCA 


AGG 


CCG 


AAA AAG 


ala cys 


ser 


arg 


pro lys 


lys 


243/81 












CGC TCG 


AGT 


ACA 


GCC 


TCG 


GCA 


arg ser 


ser 


thr 


ala 


ser 


ala 


303/101 












CCG CCG 


ACG 


ACA 


GTC 


CGG 


GCT 


pro pro 


thr 


thr 


val 


arg 


ala 


363/121 










CGG TGG 


TGC 


TGG 


TAG 


ATC 




arg trp 


cys 


trp 


AMB 


ile 





ACG 


CGA TGA TGG CGC AAC TAT CGA AAC 






ACA 


TCG 


thr 


arg OPA trp arg asn tyr arg asn 


cys 


arg 


cnr 


ser 




93/31 








GCG 


CGG TGG GCA CCC CTG GCT ATC 


AGG 


CCA 


GCG 


TCG 


ACT 


ala 


arg trp ala pro leu ala ile 


arg 


pro 


did 


ser 


tnr 




153/51 








ACA 


GCG GTT TTG ATG TGC AAA CCC 


CGG 


AGT 


TCT 


CCG 


CTC 


thr 


ala val leu met cys lys pro 


arg 


ser 


ser 


pro 


leu 




213/71 










GGG 


TGG TGA CCC TCG GCG GCA ACA 


CCG 


TGG 


AGG 


CGA 


GGG 


gly trp OPA pro ser ala ala thr 


pro 


trp 


arg 


arg 


gly 




273/91 






CAC 


CGC CGG ACG GGG TGA CGG GCC 


CGC 


TGG 


TGG 


CTG 


CCC 


his 


arg arg thr gly OPA arg ala 


arg 


trp 


trp 


leu 


pro 




333/111 








GCA 


GTC CGT CGG ACT ACG ACA GGC 


TGC 


CGG 


TGT 


CCG 


GTG 


ala 


val arg arg thr thr thr gly cys 


arg 


cys 


pro 


val 



SEQ ID N° 19C 



FIGURE 19C 



partie de la sequence nucleotidique de seq!9A 



1/1 


















31/11 


















CTA TCG 


AAA 


CTG 


CAG 


GAC 


ATC 


GCC 


AAC 


GCC 


AAC GAC 


GGC 


ACT 


CGC 


GCG 


GTG 


GGC 


ACC 


CCT 


leu ser 
61/21 


lys 


leu 


gin 


asp 


ile 


ala 


asn 


ala 


asn asp 
91/31 


gly 


thr 


arg 


ala 


val 


gly 


thr 


pro 


GGC TAT 


CAG 


GCC 


AGC 


GTC 


GAC 


TAT 


GTG 


GTA 


AAC ACA 


CTG 


CGC 


AAC 


AGC 


GGT 


TTT 


GAT 


GTG 


gly tyr 
121/41 


gin 


ala 


ser 


val 


asp 


tyr 


val 


val 


asn thr 
151/51 


leu 


arg 


asn 


ser 


gly 


phe 


asp 


val 


CAA ACC 


CCG 


GAG 


TTC 


TCC 


GCT 


CGC 


GTG 


TTC 


AAG GCC 


GAA 


AAA 


GGG 


GTG 


GTG 


ACC 


CTC 


GGC 


gin thr 
181/61 


pro 


glu 


phe 


ser 


ala 


arg 


val 


phe 


lys ala 
211/71 


glu lys 


gly val 


val 


thr 


leu 


gly 


GGC AAC 


ACC 


GTG 


GAG 


GCG 


AGG 


GCG 


CTC 


GAG 


TAC AGC 


CTC 


GGC 


ACA 


CCG 


CCG 


GAC 


GGG 


GTG 


gly asn 
241/81 


thr 


val 


glu 


ala 


arg 


ala 


leu 


glu 


tyr ser 
271/91 


leu 


gly thr 


pro 


pro 


asp 


gly 


val 


ACG GGC 


CCG 


CTG 


GTG 


GCT 


GCC 


CCC 


GCC 


GAC 


GAC AGT 


CCG 


GGC 


TGC 


AGT 


CCG 


TCG 


GAC 


TAC 


thr gly 
301/101 


pro 


leu 


val 


ala 


ala 


pro 


ala 


asp 


asp ser 
331/111 


pro 


gly cys 


ser 


pro 


ser 


asp 


tyr 


GAC AGG 


CTG 


CCG 


GTG 


TCC 


GGT 


GCG 


GTG 


GTG 


CTG GTA 


GAT 


C 














asp arg 


leu 


pro 


val 


set 


gly 


ala 


val 


val 


leu val 


asp 

















SEQ ID N° 19A' 



FIGURE 19A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



69/185 



1/1 

TAT CGA 
tyr arg 
61/21 
GCT ATC 
ala ile 
121/41 
AAA CCC 
lys pro 
181/61 
GCA ACA 
ala thr 
241/81 
CGG GCC 
arg ala 
301/101 















31/11 
















AGG 


ACA 


TCG 


CCA ACG 


CCA 


ACG ACG GCA 


CTC 


GCG 


CGG 


TGG 


GCA 


CCC 


CTG 


arg 


thr 


ser 


pro 


thr 


pro 


thr thr ala 


leu 


ala 


arg 


urp 


aid 


pro 


i «... 
leu 














91/31 












GCG 


TCG ACT 


ATG 


TGG 


TAA 


ACA CAC TGC 


GCA ACA 


GCG 


GTT 


TTG 


ATG 


TGC 


ala 


ser 


thr 


met 


trp 


OCH 


thr his cvs 

w»a^ lixij %w»yo 


ala 


thr 


ala 


val 


leu 


met 


cys 














151/51 














TCT 


CCG 


CTC 


GCG 


TGT 


TCA 


AGG CCG AAA 


AAG 


GGG 


TGG 


TGA 


CCC 


TCG 


GCG 


ser 


pro 


leu 


ala 


cys 


ser 


arg pro lys 


lys gly trp 


OPA 


pro 


ser 


ala 














211/71 














AGG 


CGA 


GGG 


CGC 


TCG 


AGT 


ACA GCC TCG 


GCA 


CAC 


CGC 


CGG 


ACG 


GGG 


TGA 


arg arg gly arg 


ser 


ser 


thr ala ser 


ala 


his 


arg 


arg 


thr 


gly 


OPA 














271/91 










TGG 


CTG 


CCC 


CCG 


CCG 


ACG 


ACA GTC CGG 


GCT 


GCA 


GTC 


CGT 


CGG 


ACT 


ACG 


trp 


leu 


pro 


pro 


pro 


thr 


thr val arg 


ala 


ala 


val 


arg 


arg 


thr 


thr 














331/111 












TGT 


CCG 


GTG 


CGG 


TGG 


TGC 


TGG TAG ATC 
















cys 


pro 


val 


arg trp 


cys 


trp AMB ile 

















SEQ ID N° 19B' 



FIGURE 19B» 



1/1 

ATC GAA ACT GCA GGA 
ile glu thr ala gly 
61/21 

CTA TCA GGC CAG CGT 
leu ser gly gin arg 
121/41 

AAC CCC GGA GTT CTC 
asn pro gly val leu 
181/61 

CAA CAC CGT GGA GGC 
gin his arg gly gly 
241/81 

GGG CCC GCT GGT GGC 
gly pro ala gly gly 
301/101 

CAG GCT GCC GGT GTC 
gin ala ala gly val 



CAT CGC CAA CGC CAA 
his arg gin arg gin 

CGA CTA TGT GGT AAA 
arg leu cys gly lys 

CGC TCG CGT GTT CAA 
arg ser arg val gin 

GAG GGC GCT CGA GTA 
glu gly ala arg val 

TGC CCC CGC CGA CGA 
cys pro arg arg arg 

CGG TGC GGT GGT GCT 
arg cys gly gly ala 



31/11 

CGA CGG CAC TCG CGC 
arg arg his ser arg 
91/31 

CAC ACT GCG CAA CAG 
his thr ala gin gin 
151/51 

GGC CGA AAA AGG GGT 
gly arg lys arg gly 
211/71 

CAG CCT CGG CAC ACC 
gin pro arg his thr 
271/91 

CAG TCC GGG CTG CAG 
gin ser gly leu gin 
331/111 
GGT AGA TC 
gly arg 



GGT 


GGG 


CAC 


CCC 


TGG 


gly 


gly 


his 


pro 


trp 


CGG 


TTT 


TGA 


TGT 


GCA 


arg 


phe 


OPA 


cys 


ala 


GGT 


GAC 


CCT 


CGG 


CGG 


gly 


asp 


pro 


arg 


arg 


GCC 


GGA 


CGG 


GGT 


GAC 


ala 


gly 


arg 


gly 


asp 


TCC 


GTC 


GGA 


CTA 


CGA 


ser 


val 


gly 


leu 


arg 



SEQ ID N° 19C 
FIGURE 19C 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



70/185 

sequence Rv0418 predite par Cole et al. (Nature 393:537-544) et contenant 
seql9A' 



1/1 






atg gtg 


aac 


aaa 


Met val 


asn 


lys 


61/21 






ctg acg 


acg 


ggc 


leu thr 


thr 


gly 


121/41 




gcc gca 


gag 


ttc 


ala ala 


glu 


phe 


181/61 






eta teg 


aaa 


ctg 


leu ser 


lys 


leu 


241/81 






ggc tat 


cag 


gcc 


gly tyr 


gin 


ala 


301/101 






caa ace 


ccg 


gag 


gin thr 


pro 


glu 


361/121 






ggc aac 


ace 


gtg 


gly asn 


thr 


val 


421/141 






acg ggc 


ccg 


ctg 


thr gly 


pro 


leu 


481/161 






gac agg 


ctg 


ccg 


asp arg 


leu 


pro 


541/181 






cag aag 


gaa 


gac 


gin lys 


glu 


asp 


601/201 






gac gag 


cag 


gcg 


asp glu 


gin 


ala 


661/221 






agt gtc 


acc 


aag 


ser val 


thr 


lys 


721/241 






etc acg 


gcg 


age 


leu thr 


ala 


ser 


781/261 






teg teg 


gcc 


aac 


ser ser 


ala 


asn 


841/281 






ate aac 


gac 


aac 


ile asn 


asp 


asn 


901/301 






tea ccg 


cat 


gtg 


ser pro 


his 


val 


961/321 






att ggg 


tea 


cga 


ile gly 


ser 


arg 



tec agg atg atg 
ser arg met met 

tgt ate egg tgg 
cys ile arg trp 

gcc gtt gcg ttg 
ala val ala leu 

cag gac ate gcc 
gin asp ile ala 

age gtc gac tat 
ser val asp tyr 

ttc tec get cgc 
phe ser ala arg 

gag gcg agg gcg 
glu ala arg ala 

gtg get gcc ccc 
val ala ala pro 

gtg tec ggt gcg 
val ser gly ala 

gca gcc gcg cag 
ala ala ala gin 

atg ggc ggc acc 
met gly gly thr 

teg gtc gga ttc 
ser val gly phe 

acc caa agt ttc 
thr gin ser phe 

gtg gtg atg gca 
val val met ala 

ggc teg gga gtg 
gly ser gly val 

tec aac gcg gta 
ser asn ala val 

aac tac gtc gag 
asn tyr val glu 







31/11 


ccg 


gcg 


gtg ctg 


pro 


ala 


val leu 






91/31 


tct 


acg 


cag teg 


ser 


thr 


gin ser 






151/51 


cgc 


aac 


egg gtg 


arg 


asn 


arg val 






211/71 


aac 


gcc 


aac gac 


asn 


ala 


asn asp 






271/91 


gtg 


gta 


aac aca 


val 


val 


asn thr 






331/111 


gtg 


ttc 


aag gcc 


val 


phe 


lys ala 






391/131 


etc 


gag 


tac age 


leu 


glu 


tyr ser 






451/151 


gcc 


gac 


gac agt 


ala 


asp 


asp ser 






511/171 


gtg 


gtg 


ctg gta 


val 


val 


leu val 






571/191 


cgc 


ggt 


gcg gtg 


arg 


gly 


ala val 






631/211 


ctg 


ggg 


get aat 


leu 


gly 


ala asn 






691/231 


cag 


eta 


cgc gga 


gin 


leu 


arg gly 






751/251 


aag 


gcc 


cgc aac 


lys 


ala 


arg asn 






811/271 


ggt 


gcg 


cat ttg 


gly 


ala 


his leu 






871/291 


get 


gcg 


gtt ctg 


ala 


ala 


val leu 






931/311 


egg 


ttc 


gcc ttc 


arg 


phe 


ala phe 






991/331 


teg 


ctg 


gac ate 


ser 


leu 


asp ile 



gcc gtg get gtg 
ala val ala val 

egg ccc gtt gtt 
arg pro val val 

age acc gac gcg 
ser thr asp ala 

ggc act cgc gcg 
gly thr arg ala 

ctg cgc aac age 
leu arg asn ser 

gaa aaa ggg gtg 
glu lys gly val 

etc ggc aca ccg 
leu gly thr pro 

ccg ggc tgc agt 
pro gly cys ser 

gat cgc ggc gtc 
asp arg gly val 

gcg ctg ate att 
ala leu ile ile 

acc gac gtc aag 
thr asp val lys 

cag tct ggg cca 
gin ser gly pro 

gtc ate gcg cag 
val ile ala gin 

gac age gtt ccg 
asp ser val pro 

gaa acg gca gtg 
glu thr ala val 

tgg ggc gcc gag 
trp gly ala glu 

gac gcg etc aaa 
asp ala leu lys 



gtc gtc gca ttc 
val val ala phe 

aac ggc ccc get 
asn gly pro ala 

atg atg gcg cac 
met met ala his 

gtg ggc acc cct 
val gly thr pro 

ggt ttt gat gtg 
gly phe asp val 

gtg acc etc ggc 
val thr leu gly 

ccg gac ggg gtg 
pro asp gly val 

ccg teg gac tac 
pro ser asp tyr 

tgt cct ttt gcc 
cys pro phe ala 

get gac aac ate 
ala asp asn ile 

ate ccg gtg gtg 
ile pro val val 

acc acc gtc aag 
thr thr val lys 

acg aag acg ggg 
thr lys thr gly 

gaa gga ccc ggc 
glu gly pro gly 

cag ctg ggg aac 
gin leu gly asn 

gaa ttc ggc ctg 
glu phe gly leu 

ggc ate gcg ctg 
gly ile ala leu 



SEQ ID N° 19 D 
FIGURE 19D 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



71/185 



1021/341 

tat ctg aac ttc gac atg ttg gcg teg ccg 
tyr leu asn phe asp met leu ala ser pro 
1081/361 

cag teg ctg peg eta gac gee cgc ggt cag 
gin ser leu pro leu asp ala arg gly gin 
1141/381 

gag cgc acg ttc gtc gee tat ctg aag atg 
glu arg thr phe val ala tyr leu lys met 
1201/401 

gac ggt egg tec gac tac gac ggc ttc acg 
asp gly arg ser asp tyr asp gly phe thr 
1261/421 

tec ggc get gag gtc aag aag tec gee gag 
ser gly ala glu val lys lys ser ala glu 
1321/441 

gag cct ttc gat ccc aac tat cac cag aag 
glu pro phe asp pro asn tyr his gin lys 
1381/461 

gcg etc ggt ate aac ggc get ggc gtc gcg 
ala leu gly ile asn gly ala gly val ala 
1441/481 

ggc ggc ccc aac ggg gtt ccg gtc atg gcg 

gly gly pro asn gly val pro val met ala 

1501/501 

tga 

OPA 



1051/351 

aac ccg ggt tac ttc ace tac gac ggt gac 

asn pro gly tyr phe thr tyr asp gly asp 
1111/371 

ccg gtg gtg ccc gaa ggc teg gee ggt ate 

pro val val pro glu gly ser ala gly ile 
1171/391 

gec ggc aag ace gcg cag gac ace teg ttc 

ala gly lys thr ala gin asp thr ser phe 
1231/411 

ctg gcg ggt ate cct teg ggt ggc ctg ttc 

leu ala gly ile pro ser gly gly leu phe 
1291/431 

caa gee gag etc tgg ggc ggc ace gee gac 

gin ala glu leu trp gly gly thr ala asp 
1351/451 

aca gac acc ctg gac cat ate gac cgc acc 

thr asp thr leu asp his ile asp arg thr 
1411/471 

tac gcg gtg ggt ttg tat gcg cag gac etc 

tyr ala val gly leu tyr ala gin asp leu 
1471/491 

gac cgc acc cgc cac ctg att gec aaa ccg 

asp arg thr arg his leu ile ala lys pro 



SEQ ID N° 19D (suite) 
FIGURE 19D (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



72/185 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0418 

31/11 



91/31 
aac aaa 
asn lys 
151/51 
acg ggc 
thr gly 
211/71 
gag ttc 
glu phe 
271/91 
aaa ctg 
lys leu 
331/111 
cag gcc 
gin ala 
391/131 
ccg gag 
pro glu 
451/151 
acc gtg 
thr val 
511/171 
ccg ctg 
pro leu 
571/191 
ctg ccg 
leu pro 
631/211 
gaa gac 
glu asp 
691/231 
cag gcg 
gin ala 
751/251 
acc aag 
thr lys 
811/271 
gcg age 
ala ser 
871/291 
gcc aac 
ala asn 
931/311 
gac aac 
asp asn 
991/331 



tag gcc 


att 


caa 


cgc 


AMB ala 


ile 


gin 


arg 


61/21 








cag gcg 


egg 


tct 


aat 


gin ala 


arg 


ser 


asn 


121/41 








gcc gtg 


get 


gtg 


gtc 


ala val 


ala 


val 


val 


181/61 








egg ccc 


gtt 


gtt 


aac 


arg pro 


val 


val 


asn 


241/81 








age acc 


gac 


gcg 


atg 


ser thr 


asp 


ala 


met 


301/101 








ggc act 


cgc 


gcg 


gtg 


gly thr 


arg 


ala 


val 


361/121 








ctg cgc 


aac 


age 


oat 


leu arg 


asn 


ser 


gly 


421/141 






gaa aaa 


ggg 


gtg 


gtg 


glu lys 


gly 


val 


val 


481/161 








etc ggc 


aca 


ccg 


ccg 


leu gly 


thr 


pro 


pro 


541/181 








ccg ggc 


tgc 


agt 


ccg 


pro gly 


cys 


ser 


pro 


601/201 








gat cgc 


ggc 


gtc 


tgt 


asp arg 


gly 


val 


cys 


661/221 








gcg ctg 


ate 


att 


get 


ala leu 


ile 


ile 


ala 


721/241 








acc gac 


gtc 


aag 


ate 


thr asp 


val 


lys 


ile 


781/261 








cag tct 


ggg 


cca 


acc 


gin ser 


gly 


pro 


thr 


841/281 








gtc ate 


gcg 


cag 


acg 


val ile 


ala 


gin 


thr 


901/301 






gac age 


gtt 


ccg 


gaa 


asp ser 


val 


pro 


glu 


961/321 






gaa acg 


gca 


gtg 


cag 


glu thr 


ala 


val 


gin 



tgg 
trp 


gat 
asp 


gcg 
ala 


aaa 
lys 


get gcg 
ala ala 


egg 
arg 


cga 
arg 


tec 
ser 


agg 
arg 


atg 
met 


atg 
met 


ccg gcg 
pro ala 


gtg 
val 


ctg 
leu 


tgt 
cys 


ate 
ile 


egg 
arg 


tgg 
trp 


tct acg 
ser thr 


cag 
gin 


teg 
ser 


gcc 
ala 


gtt 
val 


gcg 
ala 


ttg 
leu 


cgc aac 
arg asn 


egg 
arg 


gtg 
val 


cag 
gin 


gac 
asp 


ate 
ile 


gcc 
ala 


aac gcc 
asn ala 


aac 
asn 


gac 
asp 


age 
ser 


gtc 
val 


gac 
asp 


tat 
tyr 


gtg gta 
val val 


aac 
asn 


aca 
thr 


ttc 
phe 


tec 
ser 


get 
ala 


cgc 
arg 


gtg ttc 
val phe 


aag 
lys 


gcc 
ala 


gag 
glu 


gcg 
ala 


agg 
arg 


gcg 
ala 


etc gag 
leu glu 


tac 
tyr 


age 
ser 


gtg 
val 


get 
ala 


gcc 
ala 


ccc 
pro 


gcc gac 
ala asp 


gac 
asp 


agt 
ser 


gtg 
val 


tec 
ser 


ggt 
gly 


gcg 
ala 


gtg gtg 
val val 


ctg 
leu 


gta 
val 


gca 
ala 


gcc 
ala 


gcg 
ala 


cag 
gin 


cgc ggt 
arg gly 


gcg 
ala 


gtg 
val 


atg 
met 


ggc 
gly 


ggc 
gly 


acc 
thr 


ctg ggg 
leu gly 


get 
ala 


aat 
asn 


teg 
ser 


gtc 
val 


gga 
gly 


ttc 
phe 


cag eta 
gin leu 


cgc 
arg 


gga 
gly 


acc 
thr 


caa 
gin 


agt 
ser 


ttc 
phe 


aag gcc 
lys ala 


cgc 
arg 


aac 
asn 


gtg 
val 


gtg 
val 


atg 
met 


gca 
ala 


ggt gcg 
gly ala 


cat 
his 


ttg 
leu 


ggc 
gly 


teg 
ser 


gga 
gly 


gtg 
val 


get gcg 
ala ala 


gtt 
val 


ctg 
leu 


tec 
ser 


aac 
asn 


gcg 
ala 


gta 
val 


egg ttc 
arg phe 


gcc 
ala 


ttc 
phe 



SEQ ID N° 19 F 



FIGURE 19F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1021/341 

tgg ggc gcc gag gaa ttc 
trp gly ala glu glu phe 
1081/361 

gac gcg etc aaa ggc ate 
asp ala leu lys gly ile 
1141/381 

ggt tac ttc acc tac gac 
gly tyr phe thr tyr asp 
1201/401 

gtg ccc gaa ggc teg gcc 
val pro glu gly ser ala 
1261/421 

aag acc gcg cag gac acc 
lys thr ala gin asp thr 
1321/441 

ggt ate cct teg ggt ggc 
gly ile pro ser gly gly 
1381/461 

gag etc tgg ggc ggc acc 
glu leu trp gly gly thr 
1441/481 

acc ctg gac cat ate gac 
thr leu asp his ile asp 
1501/501 

gtg ggt ttg tat gcg cag 
val gly leu tyr ala gin 
1561/521 

acc cgc cac ctg att gcc 
thr arg his leu ile ala 



73/185 

1051/351 
ggc ctg att ggg tea cga aac 
gly leu ile gly ser arg asn 

1111/371 
gcg ctg tat ctg aac ttc gac 
ala leu tyr leu asn phe asp 

1171/391 
ggt gac cag teg ctg ccg eta 
gly asp gin ser leu pro leu 

1231/411 
ggt ate gag cgc acg ttc gtc 
gly ile glu arg thr phe val 

1291/431 
teg ttc gac ggt egg tec gac 
ser phe asp gly arg ser asp 

1351/451 
ctg ttc tec ggc get gag gtc 
leu phe ser gly ala glu val 

1411/471 
gcc gac gag cct ttc gat ccc 
ala asp glu pro phe asp pro 

1471/491 
cgc acc gcg etc ggt ate aac 
arg thr ala leu gly ile asn 

1531/511 
gac etc ggc ggc ccc aac ggg 
asp leu gly gly pro asn gly 

aaa ccg tga 
lys pro OPA 



tac gtc gag teg ctg gac ate 
tyr val glu ser leu asp ile 

atg ttg gcg teg ccg aac ccg 
met leu ala ser pro asn pro 

gac gcc cgc ggt cag ccg gtg 
asp ala arg gly gin pro val 

gcc tat ctg aag atg gcc ggc 
ala tyr leu lys met ala gly 

tac gac ggc ttc acg ctg gcg 
tyr asp gly phe thr leu ala 

aag aag tec gcc gag caa gcc 
lys lys ser ala glu gin ala 

aac tat cac cag aag aca gac 
asn tyr his gin lys thr asp 

ggc get ggc gtc gcg tac gcg 
gly ala gly val ala tyr ala 

gtt ccg gtc atg gcg gac cgc 
val pro val met ala asp arg 



SEQ ID N° 19F (suite) 



FIGURE 19F (suite) 



31/11 

CGA GAC AGT GGT GCG GGA CAC TTG AGT TCG GCT GCT AAC GAC GCC AGA GTC GCC CGC TTC 
arg asp ser gly ala gly his leu ser ser ala ala asn asp ala arg val ala arg phe 
61/21 91/31 

CGC GGT GTG GGA CTC ACG TTC GGT GAG GGT ACA GCG GAC CTT CGA GCA CGC AAT ATC GTG 
arg gly val gly leu thr phe gly glu gly thr ala asp leu arg ala arg asn ile val 
121/41 151/51 

GGC CGG CTG GCA ACC GTC GGT TTC GAC GTT GGT GAC GAC CCC TCG TTC ATG AAT CGT TCT 
gly arg leu ala thr val gly phe asp val gly asp asp pro ser phe met asn arg ser 
181/61 211/71 

TGA GCT CCC CGT TTT GCT GGA TGC CCA GGC ACC GCC GGT ACT GCT GCG CTT AAG CTT GTC 
OPA ala pro arg phe ala gly cys pro gly thr ala gly thr ala ala leu lys leu val 
241/81 271/91 

GCA CAT GGT GCC GGC AGG GAG GAA CAG TGG GCA AGC AGC TAG CCG CGC TCG CCG CGC TGG 
ala his gly ala gly arg glu glu gin trp ala ser ser AMB pro arg ser pro arg trp 
301/101 331/111 

TCG GTG CGT GCA TGC TCG CAG CCG GAT GCA CCA ACG TGG TCG ACG GGA CCG CCG TGG CTG 
ser val arg ala cys ser gin pro asp ala pro thr trD ser thr gly pro pro trp leu 
361/121 

CCG ACA AAT CCG GAC CAC TGC ATC AGG ATC 
pro thr asn pro asp his cys ile arg ile 

SEQ ID N° 20A 
FEUILLE DE «^|gE^REOLE 26) 



WO 99/09186 



PCI7FR98/01813 



GAG ACA 


GTG 


GTG 


CGG 


GAC 


ACT 


glu thr 


val 


val 


arq 


asp 


thr 


62/21 












GCG GTG 


TGG 


GAC 


TCA 


CGT 


TCG 


ala val 


trp 


asp 


ser 


arg 


ser 


122/41 












GCC GGC 


TGG 


CAA 


CCG 


TCG 


GTT 


ala gly 


trp 


gin 


pro 


ser 


val 


182/61 












GAG CTC 


CCC 


GTT 


TTG 


CTG 


GAT 


glu leu 


pro 


val 


leu 


leu 


asp 


242/81 










CAC ATG 


GTG 


CCG 


GCA 


GGG 


AGG 








ala 


gly 


arg 


302/101 












CGG TGC 


GTG 


CAT 


GCT 


CGC 


AGC 


arg cys 


val 


his 


ala 


arg 


ser 


362/121 










CGA CAA 


ATC 


CGG 


ACC ACT 


GCA 


arg gin 


ile 


arg 


thr 


thr 


ala 


AGA CAG 


TGG 


TGC 


GGG 


ACA 


CTT 


arg gin 


trp 


cys 


gly thr leu 


63/21 












CGG TGT 


GGG 


ACT 


CAC 


GTT 


CGG 


arg cys 


gly 


thr 


his 


val 


arg 


123/41 












CCG GCT 


GGC 


AAC 


CGT 


CGG 


TTT 


pro ala 


gly 


asn 


arg arg phe 


183/61 












AGC TCC 


CCG 


TTT 


TGC 


TGG 


ATG 


ser ser 


pro 


phe 


cys 


trp met 


243/81 












ACA TGG 


TGC 


CGG 


CAG 


GGA 


GGA 


thr trp 


cys 


arg 


gin gly gly 


303/101 












GGT GCG 


TGC 


ATG 


CTC 


GCA 


GCC 


gly ala 


cys 


met 


leu 


ala 


ala 


363/121 












GAC AAA 


TCC 


GGA 


CCA 


CTG 


CAT 


asp lys 


ser 


gly 


pro 


leu 


his 



74/185 



32/11 

TGA GTT CGG CTG CTA ACG 
OPA val arg leu leu thr 
92/31 

GTG AGG GTA CAG CGG ACC 
val arg val gin arg thr 
152/51 

TCG ACG TTG GTG ACG ACC 
ser thr leu val thr thr 

212/71 
GCC CAG GCA CCG CCG GTA 
ala gin ala pro pro val 

272/91 
AAC AGT GGG CAA GCA GCT 
asn ser gly gin ala ala 

332/111 
CGG ATG CAC CAA CGT GGT 
arg met his gin arg gly 

TCA GGA TC 
ser gly 



SEQ ID N° 20B 
FIGURE 2 OB 







33/11 




GAG TTC 


GGC 


TGC TAA 


CGA 


glu phe 


gly 


cys OCH 


arg 






93/31 




TGA GGG 


TAC 


AGC GGA 


CCT 


OPA gly 


tyr 


ser gly 


pro 






153/51 




CGA CGT 


TGG 


TGA CGA 


CCC 


arg arg 


trp 


OPA arg 


pro 






213/71 




CCC AGG 


CAC 


CGC CGG 


TAC 


pro arg 


his 


arg arg 


tyr 






273/91 




ACA GTG 


GGC 


AAG CAG 


CTA 


thr val 


gly 


lys gin 


leu 






333/111 




GGA TGC 


ACC 


AAC GTG 


GTC 


gly cys 


thr 


asn val 


val 


CAG GAT 


C 






gin asp 









SEQ ID N° 20C 



ACG CCA GAG 
thr pro glu 


TCG 
ser 


CCC 
pro 


GCT 
ala 


TCC 
ser 


TTC GAG CAC GCA 
phe glu his ala 


ATA 
ile 


TCG 
ser 


TGG 
trp 


CCT 
pro 


CGT 
arg 


TCA TGA 
ser OPA 


ATC 
ile 


GTT 
val 


CTT 
leu 


CTG 
leu 


CTG 
leu 


CGC 
arg 


TTA 
leu 


AGC 
ser 


TTG 
leu 


TCG 
ser 


AGC 
ser 


CGC 
arg 


GCT 
ala 


CGC 
arg 


CGC 
arg 


GCT 
ala 


GGT 
gly 


CGA 
arg 


CGG 
arg 


GAC 
asp 


CGC 
arg 


CGT 
arg 


GGC 
gly 


TGC 
cys 


CGC CAG 
arg gin 


AGT 
ser 


CGC 
arg 


CCG 
pro 


CTT 
leu 


CCG 
pro 


TCG AGC 
ser ser 


ACG CAA 
thr gin 


TAT 
cyr 


CGT 
arg 


GGG 
gly 


CTC 
leu 


GTT 
val 


CAT 
his 


GAA 
glu 


TCG 
ser 


TTC 
phe 


TTG 
leu 


TGC 
cys 


TGC 
cys 


GCT 
ala 


TAA 
OCH 


GCT 
ala 


TGT 
cys 


CGC 
arg 


GCC 
ala 


GCG 
ala 


CTC 
leu 


GCC 
ala 


GCG 
ala 


CTG 
leu 


GTC 
val 


GAC GGG 
asp gly 


ACC 
thr 


GCC 
ala 


GTG 
val 


GCT 
ala 


GCC 
ala 



FEUILLE DE REMP££g§filE?fflREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



75/185 

partie de la sequence nucleotidique de seq20A 
1/1 



61/21 
GCT GG( 
ala glj 
121/41 
TCC CCC 
ser pre 
181/61 
TGG TGC 
trp cys 
241/81 



301/101 

AAA TCC GGA CCA CTG CAT CAG GAT C 
lys ser gly pro leu his gin asp 





31/11 














AGC 


GGA CCT 


TCG 


AGC 


ACG CAA TAT 


CGT 


GGG 

w V7VJ 


CCG 


ser 


qlv pro 


ser 


ser 


thr gin tyr 


arg 


gly 


pro 




91/31 








TGA 


CGA CCC 


CTC 


GTT 


CAT GAA TCG 


TTC 


TTG 


AGC 


OPA 


arg pro 


leu 


val his glu ser 


phe 


leu 


ser 




151/51 












CGC 


CGG TAC 


TGC 


TGC 


GCT TAA GCT 


TGT 


CGC 


ACA 


arg 


arg tyr 


cys 


cys 


ala OCH ala 


cys 


arg 


thr 




211/71 










AAG 


CAG CTA 


GCC 


GCG 


CTC GCC GCG 


CTG 


GTC 


GGT 


lys 


gin leu 


ala 


ala 


leu ala ala 


leu 


val 


gly 




271/91 












AAC 


GTG GTC 


GAC 


GGG 


ACC GCC GJG 


GCT 


GCC 


GAC 


asn 


val val 


asp 


gly thr ala val 


ala 


ala 


asp 



SEQ ID N° 20A' 
FIGURE 2 OA' 



1/1 31/11 

GTG GGA CTC ACG TTC GGT GAG GGT ACA GCG GAC CTT CGA GCA CGC AAT ATC GTG GGC CGG 

val gly leu thr phe gly glu gly thr ala asp leu arg ala arg asn ile val gly arg 
61/21 9 1/31 

CTG GCA ACC -GTC GGT TTC GAC GTT GGT GAC GAC CCC TCG TTC ATG AAT CGT TCT TGA GCT 

leu ala thr val gly phe asp val gly asp asp pro ser phe met asn arg ser CPA ala 
121/41 151/51 

CCC CGT TTT GCT GGA TGC CCA GGC ACC GCC GGT ACT GCT GCG CTT AAG CTT GTC GCA CAT 

pro arg phe ala gly cys pro gly thr ala gly thr ala ala leu lys leu val ala his 
181/61 211/71 

GGT GCC GGC AGG GAG GAA CAG TGG GCA AGC AGC TAG CCG CGC TCG CCG CGC TGG TCG GTG 

gly ala gly arg glu glu gin trp ala ser ser AMB pro arg ser pro arg trp ser val 
241/81 271/91 

CGT GCA TGC TCG CAG CCG GAT GCA CCA ACG TGG TCG ACG GGA CCG CCG TGG CTG CCG ACA 

arg ala cys ser gin pro asp ala pro thr trp ser thr gly pro pro trp leu pro thr 

AAT CCG GAC CAC TGC ATC AGG ATC 
asn pro asp his cys ile arg ile 



SEQ ID N° 20B' 
FIGURE 20B» 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



76/185 



1/1 31/11 

GTG TGG GAC TCA CGT TCG GTG AGG GTA CAG CGG ACC TTC GAG CAC GCA ATA TCG TGG GCC 
val trp asp ser arg ser val arg val gin arg thr phe glu his ala ile ser trp ala 
61/21 91/31 

GGC TGG CAA CCG TCG GTT TCG ACG TTG GTG ACG ACC CCT CGT TCA TGA ATC GTT CTT GAG 
gly trp gin pro ser val ser thr leu val thr thr pro arg ser OPA ile val leu alu 
121/41 151/51 

CTC CCC GTT TTG CTG GAT GCC CAG GCA CCG CCG GTA CTG CTG CGC TTA AGC TTG TCG CAC 
leu pro val leu leu asp ala gin ala pro pro val leu leu arg leu ser leu ser his 
181/61 211/71 

ATG GTG CCG GCA GGG AGG AAC AGT GGG CAA GCA GCT AGC CGC GCT CGC CGC GCT GGT CGG 
met val pro ala gly arg asn ser gly gin ala ala ser arg ala arg arg ala gly arq 
241/81 271/91 

TGC GTG CAT GCT CGC AGC CGG ATG CAC CAA CGT GGT CGA CGG GAC CGC CGT GGC TGC CGA 
cys val his ala arg ser arg met his gin arg gly arg arg asp arg arg gly cys arc 
301/101 

CAA ATC CGG ACC ACT GCA TCA GGA TC 
gin ile arg thr thr ala ser gly 

SEQ ID N° 20C» 
FIGURE 20C 



sequence Rv3576 predite par Cole etal. (Nature 393:537-544) et contenant seq20A' 
1/1 31/11 

atg ggc aag cag eta gec gcg etc gec gcg ctg gtc ggt gcg tgc atg etc gca gee gga 
met gly lys gin leu ala ala leu ala ala leu val gly ala cys met leu ala ala oly 
61/21 91/31 

tgc ace aac gtg gtc gac ggg acc gec gtg get gec gac aaa tec gga cca ctg cat cag 
cys thr asn val val asp gly thr ala val ala ala asp lys ser gly pro leu his aln 
121/41 151/51 

gat ccg ata ccg gtt tea gcg ctt gaa ggg ctg ctt etc gac ttg age cag ate aat gee 
asp pro ile pro val ser ala leu glu gly leu leu leu asp leu ser gin ile asn ala 
181/61 211/71 

gcg ctg ggt gcg aca teg atg aag gtg tgg ttc aac gec aag gca atg tgg gac tgg age 
ala leu gly ala thr ser met lys val trp phe asn ala lys ala met trp asp trp se- 
241/81 271/91 

aag age gtg gee gac aag aat tgc ctg get ate gac ggt cca gca cag gaa aag gtc tat 
lys ser val ala asp lys asn cys leu ala ile asp gly pro ala gin glu lys val tvr 
301/101 331/111 

gec ggc acc ggg tgg acc get atg cgc ggc caa egg ctg gat gac age ate gat gac tec 
ala gly thr gly trp thr ala met arg gly gin arg leu asp asp ser ile asp asp ser 
361/121 391/131 

aag aaa cgc gac cac tac gec att caa gcg gtc gtc ggc ttc ccg acc gca cat gat gee 
lys lys arg asp his tyr ala ile gin ala val val gly phe pro thr ala his asp ala 
421/141 451/151 

gag gag ttc tac age tec teg gtg caa age tgg age age tgc teg aac cgc egg ttt gtc 
glu glu phe tyr ser ser ser val gin ser trp ser ser cys ser asn arg arg phe val 
481/161 511/171 

gaa gtc acc ccc gga cag gac gac gee gec tgg act gtg get gac gtt gtc aac gac aac 
glu val thr pro gly gin asp asp ala ala trp thr val ala asp val val asn asp as-. 
541/181 571/191 

ggc atg etc agt age teg cag gtt cag gaa ggc ggc gac gga tgg acc tgc cag cgt gee 
gly met leu ser ser ser gin val gin glu gly gly asp gly trp thr cys gin arg ala 
601/201 631/211 

ctg act gcg cgc aac aac gtc act ate gac att gtc acg tgc gee tat age caa ccg gat 
leu thr ala arg asn asn val thr ile asp ile val thr cys ala tyr ser gin dio asc 
661/221 691/231 

ttg gtg gcg att ggc ate get aac caa ate gcg gee aag gtt get aag cag tag 
leu val ala ile gly ile ala asn gin ile ala ala lys val ala lys gin AM3 

SEQ ID N° 20D 



FIGURE 20D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



77/185 



ORF d'apres 


Cole et al. 


{Nature 


393: 


;537- 


-544) et 


contenant Rv3576 








1/1 
















31/11 


















taa get 
OCH ala 
61/21 


tgt 
cys 


cgc 
arg 


aca tgg 
thr trp 


tgc 
cys 


egg cag 
arg gin 


Qcra 
gly 


gga aca 
gly thr 
91/31 


gtg 
val 


ggc 
gly 


aag 
lys 


cag 
gin 


eta 
leu 


gcc 
ala 


gcg 
ala 


etc 
leu 


gcc gcg 
ala ala 
121/41 


ctg 
leu 


gtc 
val 


ggt gcg 
gly ala 


tgc 
cys 


atg 
met 


etc 
leu 


oca 
ala 


arc aaa 
ala gly 
151/51 


tgc 
cys 


ace 
thr 


aac 
asn 


gtg 
val 


gtc 
val 


gac 
asp 


ggg 

gly 


aec 
thr 


gcc gtg 
ala val 
181/61 


get 
ala 


gcc 
ala 


gac aaa 
asp lys 


tec 
ser 


gga cca 
gly pro 


eta 
leu 


cat caa 
his gin 
211/71 


gat 
asp 


ccg 
pro 


ata 
ile 


ccg 
pro 


gtt 
val 


tea 
ser 


gcg 
ala 


ctt 
leu 


gaa ggg 
glu gly 
241/81 


ctg 
leu 


ctt 
leu 


etc gac 
leu asp 


ttg 
leu 


age 
ser 


cag 
gin 


ate 
ile 


aat gcc 
asn ala 
271/91 


gcg 
ala 


ctg 
leu 


ggt 
gly 


gcg 
ala 


aca 
thr 


teg 
ser 


atg 
met 


aag 
lys 


gtg tgg 
val trp 
301/101 


ttc 
phe 


aac 
asn 


gcc aag 
ala lys 


gca 
ala 


atg 
met 


tgg 
trp 


gac 
asp 


taa anr 
trp ser 
331/111 


aag 
lys 


age 
ser 


gtg 
val 


gcc 
ala 


gac 
asp 


aag 
lys 


aat 
asn 


tgc 
cys 


ctg get 
leu ala 
361/121 


ate 
ile 


gac 
asp 


ggt cca 
gly pro 


gca 
ala 


cag 
gin 


gaa 
glu 


aag 
lys 


gtc tat 
val tyr 
391/131 


gcc 
ala 


ggc 
gly 


ace 
thr 


ggg 

gly 


tgg 
trp 


ace 
thr 


get 
ala 


atg 
met 


cgc ggc 
arg gly 
421/141 


caa 
gin 


egg 
arg 


ctg gat 
leu asp 


gac 
asp 


age 
ser 


ate 
ile 


gat 
asp 


gac tec 
asp ser 
451/151 


aag 
lys 


aaa 
lys 


cgc 
arg 


gac 
asp 


cac 
his 


tac 
tyr 


gcc 
ala 


att 
ile 


caa gcg 
gin ala 
481/161 


gtc 
val 


gtc 
val 


ggc ttc 
gly phe 


ccg 
pro 


aec 
thr 


gca 
ala 


cat 
his 


gat gcc 
asp ala 
511/171 


gag 
glu 


gag 
glu 


ttc 
phe 


tac 
tyr 


age 
ser 


tec 
ser 


teg 
ser 


gtg 

val 


caa age 
gin ser 
541/181 


tgg 
trp 


age 
ser 


age tgc 
ser cys 


teg 
ser 


aac 
asn 


cgc 
arg 


arg 


phe val 
571/191 


gaa 
glu 


gtc 
val 


ace 
thr 


ccc 
pro 


gga 
gly 


cag 
gin 


gac 
asp 


gac 
asp 


gcc gcc 
ala ala 
601/201 


tgg 
trp 


act 
thr 


gtg get 
val ala 


gac 
asp 


gtt gtc 
val val 


aac 
asn 


gac aac 
asp asn 
631/211 


ggc 
gly 


atg 
met 


etc 
leu 


agt 
ser 


age 
ser 


teg 
ser 


cag 
gin 


gtt 
val 


cag gaa 
gin glu 
661/221 


ggc 
gly 


ggc 
gly 


gac gga 
asp gly 


tgg 
trp 


ace 
thr 


tgc 
cys 


cag 
gin 


cgt gcc 
arg ala 
691/231 


ctg 
leu 


act 
thr 


gcg 
ala 


cgc 
arg 


aac 
asn 


aac 
asn 


gtc 
val 


act 
thr 


ate gac 
ile asp 
721/241 


att 
ile 


gtc 
val 


a eg tgc 
thr cys 


gcc 
ala 


tat 
tyr 


age 
ser 


caa 
gin 


ccg gat 
pro asp 


ttg 
leu 


gtg 
val 


gcg 
ala 


att 
ile 


ggc 
gly 


ate 
ile 


get 
ala 


aac 
asn 


caa ate 
gin ile 


gcg 
ala 


gcc 
ala 


aag gtt 
lys val 


get 
ala 


aag cag 
lys gin 


tag 
AMB 





















SEQ ID N° 20F 
FIGURE 20F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



78/185 



1/1 






GTC CTG 


GTC 


GCC 


val leu 


val 


ala 


61/21 * 






CGC TGG 


TAG 


TGG 


arg trp 


AMB 


trp 


121/41 






GCG GCC 


TGC 


GGC 


ala ala 


cys 


<jly 


181/61 






CGG CGC 


TGG 


ACG 


arg arg 


trp 


thr 


241/81 






AAA ACT 


TCA 


CCG 


lys thr 


ser 


pro 


301/101 






CAG ACG 


TGC 


GGT 


gin thr 


cys 


gly 


361/121 






TGC TGG 


CCG 


ACA 


cys trp 


pro 


thr 



GCG CAA CTG GCC 
ala gin leu ala 

CGA TGG TGT TAG 
arg trp cys AMB 

TGG TCG CCG CGC 
trp ser pro arg 

TCG CCG TGC TGG 
ser pro cys trp 

CCC GCA AGT ACG 
pro ala ser thr 

CGG GAG TGA ACA 
arg glu OPA thr 

GCA TCG GCT TGC 
ala ser ala cys 



31/11 
GGT CCC GAT GGA 
gly pro asp gly 

91/31 
CAG GAT TGC GGG 
gin asp cys gly 

151/51 
GCG CCG AAA TGA 
ala pro lys OPA 

211/71 
CCA GCT CGA CCG 
pro ala arg pro 

271/91 
AGC TGC AGA CGC 
ser cys arg arg 

331/111 
CGC TGC TCA ACG 
arg cys ser thr 

GGG ATC 
gly ile 



AAG TGT TCA CGA 
lys cys ser arg 

TCG AGG CTG CGA 
ser arg leu arg 

TAG CCG CGA TCA 
tyr pro arg ser 

GAC ACG ATG TGG 
asp thr met trp 

GAC TGG CCG ACA 
asp trp pro thr 

GCG GTC AGG CGC 
ala val arg arg 



TCG 


CGC 


TTC 


TGC 


ser 


arg 


phe 


cys 


TGG 


CCA 


GCA 


CCA 


t- rn 

trp 


pro 


aid 


pro 


CGA 


AAT 


ACA 


TGT 


arg 


asn 


thr 


cys 


AGG 


GGG 


CGC 


AGA 


arg 


gly 


arg 


arg 


CCG 


ACG 


TCA 


TCG 


pro 


thr 


ser 


ser 


TGC 


TGG 


ATA 


AGA 


cys 


trp 


ile 


arg 



SEQ ID N° 21A 
FIGURE 21A 



TCC TGG TCG CCG CGC AAC TGG CCG GTC CCG 
ser trp ser pro arg asn trp pro val pro 
62/21 

GCT GGT AGT GGC GAT GGT GTT AGC AGG ATT 
ala gly ser gly asp gly val ser arg ile 
122/41 

CGG CCT GCG GCT GGT CGC CGC GCG CGC CGA 
arg pro ala ala gly arg arg ala arg arg 
182/61 

GGC GCT GGA CGT CGC CGT GCT GGC CAG CTC 
gly ala gly arg arg arg ala gly gin leu 
242/81 

AAA CTT CAC CGC CCG CAA GTA CGA GCT GCA 
lys leu his arg pro gin val arg ala ala 
302/101 

AGA CGT GCG GTC GGG AGT GAA CAC GCT GCT 
arg arg ala val gly ser glu his ala ala 
362/121 

GCT GGC CGA CAG CAT CGG CTT GCG GGA TC 
ala gly arg gin his arg leu ala gly 



32/11 



ATG GAA 


AGT 


GTT CAC GAT 


CGC 


GCT 


TCT 


GCC 


met glu 


ser 


val his asp 


arg 


ala 


ser 


ala 


92/31 












GCG GGT 


CGA 


GGC TGC GAT 


GGC 


CAG 


CAC 


CAG 


ala gly 


arg gly cys asp gly 


gin 


his 


gin 


152/51 










AAT GAT 


ACC 


CGC GAT CAC 


GAA 


ATA 


CAT 


GTC 


asn asp 


thr 


arg asp his 


glu 


ile 


his 


val 


212/71 












GAC CGG 


ACA 


CGA TGT GGA 


GGG 


GGC 


GCA 


GAA 


asp arg 


thr 


arg cys gly gly 


gly 


ala 


glu 


272/91 










GAC GCG 


ACT 


GGC CGA CAC 


CGA 


CGT 


CAT 


CGC 


asp ala 


thr gly arg his 


arg 


arg 


his 


arg 


332/111 










CAA CGG 


CGG 


TCA GGC GCT 


GCT 


GGA 


TAA 


GAT 


gin arg 


arg 


ser gly ala 


ala 


gly 


OCH 


asp 



SEQ ID N° 21B 



FIGURE 21B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCTVFR98/01813 



79/185 



CCT GGT CGC CGC GCA ACT GGC CGG TCC CGA 
pro gly arg arg ala thr gly arg ser arg 
63/21 

CTG GTA GTG GCG ATG GTG TTA GCA GGA TTG 
leu val val ala met val leu ala gly leu 
123/41 

GGC CTG CGG CTG GTC GCC GCG CGC GCC GAA 
gly leu arg leu val ala ala arg ala glu 
183/61 

GCG CTG GAC GTC GCC GTG CTG GCC AGC TCG 
ala leu asp val ala val leu ala ser ser 
243/81 y 
AAC TTC ACC GCC CGC AAG TAC GAG CTG CAG 
asn phe thr ala arg lys tyr glu leu gin 
303/101 

GAC GTG CGG TCG GGA GTG AAC ACG CTG CTC 
asp val arg ser gly val asn thr leu leu 
363/121 

CTG GCC GAC AGC ATC GGC TTG CGG GAT C 
leu ala asp ser ile gly leu arg asp 



SEQ ID N° 21C 
FIGURE 21C 



partie de la sequence nucleotidique de seq21A 



1/1 
















31/11 














ACG ATC 


GCG 


CTT 


CTG CCG 


CTG 


GTA 


GTG 


GCG 


ATG GTG 


TTA 


GCA 


GGA 


TTG 


CGG GTC GAG 


GCT 


thr ile 


ala 


leu 


leu pro 


leu 


val 


val 


ala 


met val 


leu 


ala gly leu 


arg val glu ala 


61/21 
















91/31 














GCG ATG 


GCC 


AGC 


ACC AGC 


GGC 


CTG 


CGG 


CTG 


GTC GCC 


GCG 


CGC 


GCC 


GAA 


ATG ATA CCC 


GCG 


ala met 


ala 


ser 


thr ser 


gly leu arg 


leu 


val ala 


ala 


arg 


ala 


glu 


met ile pro 


ala 


121/41 
















151/51 












ATC ACG 


AAA 


TAC 


ATG TCG 


GCG 


CTG 


GAC 


GTC 


GCC GTG 


CTG 


GCC 


AGC 


TCG 


ACC GGA CAC 


GAT 


ile thr 


lys 


tyr 


met ser 


ala 


leu 


asp 


val 


ala val 


leu 


ala 


ser 


ser 


thr gly his 


asp 


181/61 
















211/71 










GTG GAG 


GGG 


GCG 


CAG AAA 


AAC 


TTC 


ACC 


GCC 


CGC AAG 


TAC 


GAG 


CTG 


CAG 


ACG CGA CTG 


GCC 


val glu 


gly 


ala 


gin lys 


asn 


phe thr 


ala 


arg lys 


tyr glu 


leu gin 


thr arg leu 


ala 


241/81 
















271/91 












GAC ACC 


GAC 


GTC 


ATC GCA 


GAC 


GTG 


CGG 


TCG 


GGA GTG 


AAC 


ACG 


CTG 


CTC 


AAC GGC GGT 


CAG 


asp thr 


asp 


val 


ile ala 


asp 


val 


arg 


ser 


gly val 


asn 


thr 


leu 


leu 


asn gly gly qln 


301/101 
















331/111 














GCG CTG 


CTG 


GAT 


AAG ATG 


CTG 


GCC 


GAC 


AGC 


ATC GGC 


TTG 


CGG 


GAT 


C 






ala leu 


leu 


asp 


lys met 


leu 


ala 


asp 


ser 


ile gly 


leu 


arg 


asp 









SEQ ID N° 21A' 
FIGURE 21A' 



33/11 

TGG AAA GTG TTC ACG 
trp lys val phe thr 
93/31 

CGG GTC GAG GCT GCG 
arg val glu ala ala 
153/51 

ATG ATA CCC GCG ATC 
met ile pro ala ile 
213/71 

ACC GGA CAC GAT GTG 
thr gly his asp val 
273/91 

ACG CGA CTG GCC GAC 
thr arg leu ala asp 
333/111 

AAC GGC GGT CAG GCG 
asn gly gly gin ala 



ATC GCG CTT CTG CCG 
ile ala leu leu pro 

ATG GCC AGC ACC AGC 
met ala ser thr ser 

ACG AAA TAC ATG TCG 
thr lys tyr met ser 

GAG GGG GCG CAG AAA 
glu gly ala gin lys 

ACC GAC GTC ATC GCA 
thr asp val ile ala 

CTG CTG GAT AAG ATG 
leu leu asp lys met 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



80/185 



1/1 31/11 

CGA TCG CGC TTC TGC CGC TGG TAG TGG CGA TGG TGT TAG CAG GAT TGC GGG TCG AGG CTG 
arg ser arg phe cys arg trp AMB trp arg trp cys AMB gin asp cys gly ser arg leu 
61/21 91/31 

CGA TGG CCA GCA CCA GCG GCC TGC GGC TGG TCG CCG CGC GCG CCG AAA TGA TAC CCG CGA 
arg trp pro ala pro ala ala cys gly trp ser pro arg ala pro lys OPA tyr pro arq 
121/41 151/51 

TCA CGA AAT ACA TGT CGG CGC TGG ACG TCG CCG TGC TGG CCA GCT CGA CCG GAC ACG ATG 
ser arg asn thr cys arg arg trp thr ser pro cys trp pro ala arg pro asp thr met 
181/61 211/71 

TGG AGG GGG CGC AGA AAA ACT TCA CCG CCC GCA AGT ACG AGC TGC AGA CGC GAC TGG CCG 
trp arg gly arg arg lys thr ser pro pro ala ser thr ser cys arg arg asp trp pro 
241/81 271/91 

ACA CCG ACG TCA TCG CAG ACG TGC GGT CGG GAG TGA ACA CGC TGC TCA ACG GCG GTC AGG 

thr pro thr ser ser gin thr cys gly arg glu OPA thr arg cys ser thr ala val arq 

301/101 331/111 

CGC TGC TQG ATA AGA TGC TGG CCG ACA GCA TCG GCT TGC GGG ATC 

arg cys trp ile arg cys trp pro thr ala ser ala cys gly ile 



SEQ ID N° 21B« 
FIGURE 21B' 



1/1 

CAC GAT CGC GCT TCT GCC GCT GGT AGT GGC 
his asp arg ala ser ala ala gly ser gly 
61/21 

TGC GAT GGC CAG CAC CAG CGG CCT GCG GCT 
cys asp gly gin his gin arg pro ala ala 
121/41 

GAT CAC GAA ATA CAT GTC GGC GCT GGA CGT 
asp his glu ile his val gly ala gly arg 
181/61 

TGT GGA GGG GGC GCA GAA AAA CTT CAC CGC 
cys gly gly gly ala glu lys leu his arg 
241/81 

CGA CAC CGA CGT CAT CGC AGA CGT GCG GTC 
arg his arg arg his arg arg arg ala val 
301/101 

GGC GCT GCT GGA TAA GAT GCT GGC CGA CAG 
gly ala ala gly OCH asp ala gly arg gin 



31/11 



GAT GGT GTT 


AGC 


AGG 


ATT 


GCG 


GGT 


CGA 


GGC 


asp gly val 


ser 


arg 


ile 


ala 


gly 


arg 


gly 


91/31 










GGT CGC CGC 


GCG 


CGC 


CGA 


AAT 


GAT 


ACC 


CGC 


gly arg arg 


ala 


arg 


arg 


asn 


asp 


thr 


arg 


151/51 












CGC CGT GCT 


GGC 


CAG 


CTC 


GAC 


CGG 


ACA 


CGA 


arg arg ala 


gly gin leu 


asp 


arg 


thr 


arg 


211/71 










CCG CAA GTA 


CGA 


GCT 


GCA 


GAC 


GCG 


ACT 


GGC 


pro gin val 


arg 


ala 


ala 


asp 


ala 


thr 


gly 


271/91 












GGG AGT GAA 


CAC 


GCT 


GCT 


CAA 


CGG 


CGG 


TCA 


gly ser glu 


his 


ala 


ala 


gin 


arg 


arg 


ser 


331/111 










CAT CGG CTT 


GCG 


GGA 


TC 










his arg leu 


ala 


gly 













SEQ ID N° 21C 
FIGURE 21C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



81/185 



sequence Rv3365c predite par Cole et 
Seq2lA' 

1/1 

gtg acc atg ttc gcc cgc ccg acc ate ccg 
val thr met phe ala arg pro thr lie pro 
61/21 

ccg get caa ccg gcc cgc ggc aaa cct cag 
pro ala gin pro ala arg gly lys pro gin 
121/41 

tgg ccg gtc cga tgg aaa gtg ttc acg ate 
trp pro val arg trp lys val phe thr ile 
181/61 

tta gca gga ttg egg gtc gag get gcg atg 
leu ala gly leu arg val glu ala ala met 
241/81 

gcg cgc gcc gaa atg ata ccc gcg ate acg 
ala arg ala glu met ile pro ala ile thr 
301/101 

ctg gcc age teg acc gga cac gat gtg gag 
leu ala ser ser thr gly his asp val glu 
361/121 

tac gag ctg cag acg cga ctg gcc gac acc 
tyr glu leu gin thr arg leu ala asp thr 
421/141 

aac acg ctg etc aac ggc ggt cag gcg ctg 
asn thr leu leu asn gly gly gin ala leu 
481/161 

ttg egg gat egg gtc acc gcc tac gcg ccg 
leu arg asp arg val thr ala tyr ala pro 
541/181 

gcg teg gtg egg gtt gac age gag caa ate 
ala ser val arg val asp ser glu gin ile 
601/201 

gtt ggc gcc cgc ggg cag atg acg atg cag 
val gly ala arg gly gin met thr met gin 
661/221 

gcc gag ccg caa ctg cgc age gcg atg gtt 
ala glu pro gin leu arg ser ala met val 
721/241 

ttc ggg atg age gcg gcg etc ggt gca ggc 
phe gly met ser ala ala leu gly ala gly 
781/261 

atg gtg acc agg atg gcg ate atg tec gat 
met val thr arg met ala ile met ser asp 
841/281 

ctg ctg cac teg ata cag ate acc cgc gac 
leu leu his ser ile gin ile thr arg asp 
901/301 . 

gag gcg gtg acg aag teg gtg caa age cag 
glu ala val thr lys ser val gin ser gin 
961/321 

gac gcc gtg ctg gtg ttg gcc gcc ate gcg 
asp ala val leu val leu ala ala ile ala 



al. (Nature 393:537-544) et contenant 



31/11 


















gtc gcg 
val ala 
91/31 


gcg 
aia 


gcc 
ala 


get 
ala 


tct 
ser 


gat 
asp 


att 
ile 


tec 
ser 


gcc 
ala 


caa cgc 
gin arg 
151/51 


ccg 
pro 


ccg 
pro 


tec 
ser 


tgg 
trp 


teg 
ser 


ccg 
pro 


cgc 
arg 


aac 
asn 


gcg ctt 
ala leu 
211/71 


ctg 
leu 


ccg 
pro 


ctg 
leu 


gta 
val 


gtg 
val 


gcg atg 
ala met 


gtg 
val 


gcc age 
ala ser 
271/91 


acc 
thr 


age 
ser 


ggc 
gly 


ctg 
leu 


egg 
arg 


ctg gtc 
leu val 


gcc 
ala 


aaa tac 
lys tyr 
331/111 


atg 
met 


teg 
ser 


gcg 
ala 


ctg 
leu 


gac 
asp 


gtc gcc 
val ala 


gtg 
val 


ggg gcg 
gly ala 
391/131 


cag 
gin 


aaa 
lys 


aac 
asn 


ttc 
phe 


acc 
thr 


gcc 
ala 


cgc 
arg 


aag 
lys 


gac gtc 
asp val 
451/151 


ate 

j i _ 
ile 


gca 
ala 


gac 
asp 


gtg 
val 


egg 
arg 


teg gga 
ser gly 


gtg 
val 


ctg gat 
leu asp 
511/171 


aag 
lys 


gtg 
val 


ctg 
leu 


gcc 
ala 


gac 
asp 


age 
ser 


ate 
ile 


ggc 
gly 


ctg ctg 
leu leu 
571/191 


ttg 

1 an 

leu 


acg 
tnr 


gcc 
ala 


cag 
gin 


aac 
asn 


gtg 

val 


att 
ile 


gac 
asp 


cga acc 
arg thr 
631/211 


cag 

m 1 mm 

gin 


gtg 
val 


cag 
gin 


ggt 
gly 


ttg 
leu 


age 
ser 


cga 
arg 


gcc 
ala 


gag ate 
glu ile 
691/231 


ctg 

1 All 

leu 


gtg 
vai 


act 
tnr 


cgc 
arg 


ggc 
gly 


gcc 
ala 


gac 
asp 


ctt 
leu 


acc ctg 
thr leu 
751/251 


gcc 
ala 


ggc 
gly 


acc 

U mm 

tnr 


gaa 
glu 


ccc 
pro 


teg 
ser 


acg 
thr 


ctg 
leu 


ser pro 
811/271 


gac 
asp 


acc 
thr 


aag 
lys 


aac 
asn 


ctg 
leu 


cag cag 
gin gin 


caa 
gin 


ccg gcc 
pro ala 
871/291 


gtt 
val 


gca 
ala 


ctg 
leu 


gtc 
val 


aac 
asn 


aac 
asn 


cca 
pro 


gag 
glu 


att gcc 
ile ala 
931/311 


gag 
glu 


cag 
gin 


gtg 
val 


ate 
ile 


acc 
thr 


gac 
asp 


acc 
thr 


acc 
thr 


gcc acc 
ala thr 
991/331 


gac 
asp 


egg 
arg 


egg 
arg 


gat 
asp 


gcc 
ala 


gcg 
ala 


att 
ile 


cgc 
arg 


acc gcg 
thr ala 


ate 
ile 


gtc 
val 


gtc 
val 


gtg 
val 


ttg 
leu 


gtg 
val 


gtg 
val 


gcg 
ala 



SEQ ID N° 21F 



FIGURE 21D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



82/185 



1021/341 

cgc acg ctg gtc ggg 
arg thr leu val gly 
1081/361 

gat etc gac ggc gag 
asp leu asp gly glu 
1141/381 

gcg gtg tac acc acc 
ala val tyr thr thr 
1201/401 

egg gcc ctg ttg ctg 
arg ala leu leu leu 
1261/421 

gag acc atg teg egg 
glu thr met ser arg 
1321/441 

ctg gag cgc aac gag 
leu glu arg asn glu 
1381/461 

gcc gcc egg ctg cgc 
ala ala arg leu arg 
1441/481 

cgt gac cac cgc gag 
arg asp his arg glu 
1501/501 

gag gac tat cgc cgc 
glu asp tyr arg arg 
1561/521 

get ggt ggc gtc att 
ala gly gly val ile 
1621/541 

ccg acc acaccc gtt 
pro thr thr pro val 
1681/561 

ate teg gat tec ggc 
ile ser asp ser gly 
1741/581 

egg gcc ggc ggt gag 
arg ala gly gly glu 
1801/601 

egg ctg gcc ggt egg 
arg leu ala gly arg 
1861/621 

ggc acc ggc acc acc 
gly thr gly thr thr 
1921/641 

gcg cag ccg cca aag 
ala gin pro pro lys 
1981/661 

gcc gat ccg acg gac 
ala asp pro thr asp 



ccg atg 
pro met 


egg gta ctg 
arg val leu 


ate 
ile 


gcg 
ala 


gcg 
ala 


gtc cgc 
val arg 


gag 
glu 


gaa 
glu 


ate ggt cag 
ile gly gin 


gcc ggc 
ala gly 


gag gaa acg 
glu glu thr 


cgt 
arg 


age 
ser 


cgt 
arg 


tec ctg 
ser leu 


gag gat 
glu asp 


ccc 
pro 


gcc cga 
ala arg 


cgc 
arg 


aac 
asn 


age 
ser 


gcc aac 
ala asn 


ccg 
pro 


gtg 
val 


ccg 
pro 


ctg tea 
leu ser 


gtc 
val 


gac 
asp 


ate 
ile 


gcg agg 
ala arg 


cat 
his 


ctg 
leu 


ctt gcc gag 
leu ala glu 


egg 
arg 


gtt 
val 


gcc 
ala 


gcc gca 
ala ala 


ctg ggc 
leu gly 


atg 
met 


acc gat 
thr asp 


gtc 
val 


acc 
thr 


ccg 
pro 


gat agt 
asp ser 


cac ggc 
his gly 


ate cga gtc 
ile arg val 


gcc gag 
ala glu 


gtc 
val 


tac ctg 
tyr leu 


ccg 
pro 


egg 
arg 


gta ttt gcg 
val phe ala 


gtt 
val 


ccc 
pro 


gcc 
ala 


gcc ate 
ala ile 



1051/351 

cgt gat ggg gcg etc 
arg asp gly ala leu 
1111/371 

gcc ggc gac gag ccg 
ala gly asp glu pro 
1171/391 

gtc gcg cat gcg gtc 
val ala his ala val 
1231/411 

egg ttg cga ctg ctg 
arg leu arg leu leu 
1291/431 

gtc gac cag cag ctg 
val asp gin gin leu 
1351/451 

etc gac age ctt ttc 
leu asp ser leu phe 
1411/471 

ctg ctg gtg ctg gcc 
leu leu val leu ala 
1471/491 

acc gtg ate age gcc 
thr val ile ser ala 
1531/511 

gta ccc gac tgt gcg 
val pro asp cys ala 
1591/531 

ctg ate gac aac gcg 
leu ile asp asn ala 
1651/551 

ate ggc age gaa ggc 
ile gly ser glu gly 
1711/571 

gcc gat egg egg atg 
ala asp arg arg met 
1771/591 

gcc egg cac atg ggt 
ala arg his met gly 
1831/611 

ggg ctg cgc ggt ccg 
gly leu arg gly pro 
1891/631 

ccg eta gcc gtg etc 
pro leu ala val leu 
1951/651 

ate aag ccg ccg tgt 
ile lys pro pro cys 
2011/671 

ggg ccg eta cca ccg 
gly pro leu pro pro 



aag gtt 
lys val 


get 
ala 


cat 
his 


acc 
thr 


ate ccc 
ile pro 


gag cca ctg 
glu pro leu 


gac gag 
asn olii 

w uXU 


ctg 
leu 


cac 
his 


acc 
thr 


gtc aac 

VOX CtJll 


gag atg ttt 
glu met phe 


teg gtc 

car \ra 1 


ate 
ile 


gac 
asp 


caa 
gin 


egg etc 


gat 
asp 


cac 
his 


ctg 
leu 


ggt gcg 
gly ala 


cag att 
gin ile 


acc 
thr 


gcc gtg 
ala val 


tea 
ser 


gag gtc 
glu val 


gta gtc 

v a jl val 


ggc gca 
gly ala 


gcg 
ala 


ttg cgc 
leu arg 


tac 
tyr 


teg 
ser 


tea 
ser 


agt gtt 
ser val 


ctg 
leu 


ctg 
leu 


cga 
arg 


gcc aat 
ala asn 


atg 
met 


egg 
arg 


ctg 
leu 


ctg ttc 
leu phe 


gta 
val 


gtc 
val 


ggc 
gly 


gtg acc 
val thr 


ggt gaa cag 
gly glu gin 


gag ggg 
glu gly 


acg 
thr 


gcc 
ala 


cca 
pro 


cct gaa 
pro glu 


ccc 
pro 


gcg 
ala 


gcg 
ala 


gtc acg 
val thr 


ttg 
leu 


etc 
leu 


ccg 
pro 



SEQ ID N° 21D (suite 1) 
FIGURE 21D (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



83/185 



2041/681 

cgc cgt acc ccg ggg 
arg arg thr pro gly 
2101/701 

egg cgc gag ctg aaa 
arg arg glu leu lys 
2161/721 

ccc gca cca gaa ccg 
pro ala pro glu pro 
2221/741 

gtt gat gac gac gtc 
val asp asp asp val 
2281/761 

ctg gec cac age ccc 
leu ala his ser pro 
2341/781 

gec gag gee gcg gac 
ala glu ala ala asp 
2401/801 

ccc ggg gee egg tta 
pro gly ala arg leu 
2461/821 

ggt gca gcg eta gca 
gly ala ala leu ala 
2521/841 

gcg gta cgc gac ccc 
ala val arg asp pro 
2581/861 

acc ggg egg teg cat 
thr gly arg ser his 



tec agt ggc ate gec 
ser ser gly ile ala 

aca ccc tgg tgg gag 
thr pro trp trp glu 

cga ccg gcg ccg ccg 
arg pro ala pro pro 

ate tac egg egg atg 
ile tyr arg arg met 

gat ctg gac tgg aag 
asp leu asp trp lys 

aag ccc gtg cag tec 
lys pro val gin ser 

gtg ccg ggg gcg gcg 
val pro gly ala ala 

tec aac ggc gga ctt 
ser asn gly gly leu 

gac gcg gtt cgt gee 
asp ala val arg ala 

gee cgc gag age agt 
ala arg glu ser ser 



2071/691 

gac gtc ccg gee cag 
asp val pro ala gin 
2131/711 

gat agg ttt caa cag 
asp arg phe gin gin 
2191/731 

ccc gee aaa ccc gcg 
pro ala lys pro ala 
2251/751 

etc tec gag atg gtg 
leu ser glu met val 
2311/771 

teg gtg tgg gac cac 
ser val trp aso his 
2371/791 

cgc acg gac tac ggc 
arg thr asp tyr gly 
2431/811 

gtg cct gag gga ccc 
val pro glu gly pro 
2491/831 

cat ccc ggc cga gcg 
his pro gly arg ala 
2551/851 

tec ate age age cat 
ser ile ser ser his 
2611/871 

cag gga ccc aat cag 
gin gly pro asn gin 



ccg atg 
pro met 


cag 
gin 


cag egg 
gin arg 


gag ccc 
glu pro 


aaa 
lys 


caa ccg 
gin pro 


cca ccg 
pro pro 


gcg 
ala 


ggc ccg 
gly pro 


ggt gac 
gly asp 


ccg 
pro 


cac gag 
his glu 


ggc tgg 
gly trp 


teg 
ser 


gcg 
ala 


gee 
ala 


ctg ccg 
leu pro 


gtg 
val 


cgc 
arg 


gaa 
glu 


gat egg 
asp arg 


gag 
glu 


cat 
his 


ccg 
pro 


ccg egg 
pro arg 


cac 
his 


gcg 
ala 


get 
ala 


ttc ggc 
phe gly 


ggc 
gly 


gtg 
val 


cgc 
arg 


caa tga 
gin OPA 









SEQ ID N° 21D (suite) 
FIGURE 21D (suite) 



FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



84/185 



ORF d'apres par Cole et al. (Nature 393:537-544) et contennant Rv3365c 

31/11 



91/31 
gcc ccg 
ala pro 
151/51 
aac tgg 
asn trp 
211/71 
gtg tta 
val leu 
271/91 
gcc gcg 
ala ala 
331/111 
gtg ctg 
val leu 
391/131 
aag tac 
lys tyr 
451/151 
gtg aac 
val asn 
511/171 
ggc ttg 
gly leu 
571/191 
gac gcg 
asp ala 
631/211 
gcc gtt 
ala val 
691/231 
ctt gcc 
leu ala 
751/251 
ctg ttc 
leu phe 
811/271 
caa atg 
gin met 
871/291 



taa ggg 
OCH gly 
61/21 


tgc 
cys 


aac 

3 3 

gly 


caa 

3 3 

arg 


taa 
trp 


cac 
his 


aac 

y y 
gly 


ccg gtc 
pro val 
121/41 


gcg 
ala 


acq 

3 3 

ala 


qcc 
ala 


act 

3 w 

ala 


tct 
ser 


gat 
asp 


cag caa 
gin gin 
181/61 


cqc 
arg 


cca 
pro 


cca 
pro 


tec 
ser 


tgg 
trp 


teg 
ser 


ate acq 
33 

ile ala 
241/81 


ctt 
leu 


eta 

^3 

leu 


cca 
pro 


ctg 
leu 


gta 
val 


gtg 
val 


ata acc 
met ala 
301/101 


aac 

" 3 w 

ser 


acc 
thr 


age 
ser 


aac 

yy *- 
gly 


ctg 
leu 


egg 
arg 


acg aaa 
thr lys 
361/121 


tac 
tyr 


ata 
met 


tea 
ser 


y *-~y 
ala 


ctg gac 
leu asp 


qaq qqq 

3^3 333 

glu gly 
421/141 


qca 

3 3 

ala 


caa 
gin 


aaa 
lys 


aac 
asn 


ttc 
phe 


acc 
thr 


acc gac 
thr asp 
481/161 


ate 
val 


ate 
ile 


gca 
ala 


gac 
asp 


gtg 
val 


egg 
arg 


ctg ctg 
leu leu 
541/181 


gat 
asp 


aaq 
lys 


ata 

3 *"3 

val 


eta 
leu 


gcc 
ala 


gac 
asp 


ccg ctg 
pro leu 
601/201 


ctg 
leu 


ttg 
leu 


acq 
thr 


acc 
ala 


cag 
gin 


aac 
asn 


ate cga 
ile arg 
661/221 


acc 
thr 


cag 
gin 


gtg 
val 


cag 
gin 


ggt ttg 
gly leu 


cag gag 
gin glu 
721/241 


ate 
ile 


ctg 
leu 


gtg 
val 


act 
thr 


cgc ggc 
arg gly 


gtt acc 
val thr 
781/261 


ctg 
leu 


gcc 
ala 


ggc 
gly 


acc 
thr 


gaa ccc 
glu pro 


ggc teg 
gly ser 
841/281 


ccg 
pro 


gac 
asp 


acc 
thr 


aag 
lys 


aac 
asn 


ctg 
leu 


gat ccg 
asp pro 


gcc 
ala 


gtt 
val 


gca 
ala 


ctg 
leu 


gtc 
val 


aac 
asn 



acc 
thr 


atg 
met 


ttc 
phe 


gcc 
ala 


cgc 
arg 


ccg 
pro 


acc 
thr 


ate 
ile 


get 
ala 


caa 
gin 


ccg 
pro 


gcc 
ala 


cgc 
arg 


ggc 
gly 


aaa cct 
lys pro 


ccg 
pro 


gtc 
val 


cga 
arg 


tgg 
trp 


aaa 
lys 


gtg 
val 


ttc 
phe 


acg 
thr 


gca 
ala 


gga 
gly 


ttg 
leu 


egg 
arg 


gtc 
val 


gag 
glu 


get 
ala 


gcg 
ala 


cgc 
arg 


gcc 
ala 


gaa 
glu 


atg 
met 


ata 
ile 


ccc 
pro 


gcg 
ala 


ate 
ile 


gcc 
ala 


age 
ser 


teg 
ser 


acc 
thr 


gga 

gly 


cac 
his 


gat 
asp 


gtg 
val 


gag 
glu 


ctg 
leu 


cag 
gin 


acg 
thr 


cga 
arg 


ctg 
leu 


gcc 
ala 


gac 
asp 


acg 
thr 


ctg 
leu 


etc 
leu 


aac 
asn 


ggc 
gly 


ggt 
gly 


cag gcg 
gin ala 


egg 
arg 


gat 
asp 


egg 
arg 


gtc 
val 


acc 
thr 


gcc 
ala 


tac 
tyr 


gcg 
ala 


teg 
ser 


gtg 
val 


egg 
arg 


gtt 
val 


gac 
asp 


age 
ser 


gag caa 
glu gin 


ggc 
gly 


gcc 
ala 


cgc 
arg 


ggg 

gly 


cag 
gin 


atg 
met 


acg 
thr 


atg 
met 


gag 
glu 


ccg 
pro 


caa 
gin 


ctg 
leu 


cgc 
arg 


age 
ser 


gcg 
ala 


atg 
met 


ggg 

gly 


atg 
met 


age 
ser 


gcg 
ala 


gcg 
ala 


etc 
leu 


ggt gca 
gly ala 


gtg 
val 


acc 
thr 


agg 
arg 


atg 
met 


gcg 
ala 


ate 
ile 


atg 
met 


tec 
ser 


ctg 
leu 


cac 
his 


teg 
ser 


ata 
ile 


cag 
gin 


ate 
ile 


acc 
thr 


cgc 
arg 



SEQ ID N° 21F 
FIGURE 21F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



85/185 



901/301 






gac att gcc 


oao 


cag 


asp ile ala 


alu 


gin 


961/321 






cag gcc acc 


gac 


caa 

*-y y 


gin ala thr 


asD 


arg 


1021/^41 






accr acc aca 


ate 


gtc 


ala thr ala 


ile 


val 


1081/361 






eta cot cat 


yyy 


aca 


leu arg asp 


alv 

y jt 


ala 


1141/381 

111 A( S V ± 






cgc gcc ggc 


gac 


nan 

yay 


arg ala gly 


asp 


glu 


1201/401 






MA rrt*f* acct 


rat 


gcg 


oln val ala 

^JWA* VlXU 


his 


ala 


1ZD1/ 4^ X 






aca caa t* t" n 
civ»y \»y y Ley 


y ci 


ctg 


thr arg leu 


arg 


leu 


lJtl/ nil 






cto ate ciac 

wt»y v^i>i* ya\^ 


parr 


cag 


leu val asp 


gin 


aln 

y ah 


1381/461 






caa. etc flac 


age 


ctt 


arg leu asp 


ser 


1 Oil 

x c u 


1441/481 






aac ctg ctg 


y u y 


ctg 


asn leu leu 


val 


leu 


1501/501 






tea acc gtg 


ate 


age 


ser thr val 


ile 


ser 


1561/521 






agg gta ccc 


oac 


tgt 


arg val pro 


asp 


cvs 


1621/541 






gag ctg ate 


gac 


aac 


glu leu ile 


asp 


asn 


1681/561 






gca ate ggc 


age 


gaa 


ala ile gly 


ser 


glu 


1741/581 




gat gcc gat 


egg 


egg 


asp ala asp 


arg 


arg 


1801/601 






agt gcc egg 


cac 


atg 


ser ala arg 


his 


met 



gtg ate 
val ile 

egg gat 
arg asp 

gtc gtg 
val val 

etc aag 
leu lys 

ccg ate 
pro ile 

gtc gac 
val asp 

ctg gtc 
leu val 

ctg teg 
leu ser 

ttc egg 
phe arg 

gcc ggt 
ala gly 

gcc gcc 
ala ala 

gcg gta 
ala val 

gcg ttg 
ala leu 

ggc agt 
gly ser 

atg gcc 
met ala 

ggt ctg 
gly leu 



acc gac acc 
thr asp thr 

gcc gcg att 
ala ala ile 

ttg gtg gtg 
leu val val 

gtt get cat 
val ala his 

ccc gag cca 
pro glu pro 

gag ctg cac 
glu leu his 

aac gag atg 
asn glu met 

gtc ate gac 
val ile asp 

etc gat cac 
leu asp his 

gcg cag att 
ala gin ile 

gtg tea gag 
val ser glu 

gtc ggc gca 
val gly ala 

cgc tac teg 
arg tyr ser 

gtt ctg ctg 
val leu leu 

aat atg egg 
asn met arg 

ttc gta gtc 
phe val val 



931/311 
acc gag gcg 
thr glu ala 
991/331 
cgc gac gcc 
arg asp ala 
1051/351 
gcg cgc acg 
ala arg thr 
1111/371 
acc gat etc 
thr asp leu 
1171/391 
ctg gcg gtg 
leu ala val 
1231/411 
acc egg gcc 
thr arg ala 
1291/431 
ttt gag acc 
phe glu thr 
1351/451 
caa ctg gag 
gin leu glu 
1411/471 
ctg gcc gcc 
leu ala ala 
1471/491 
acc cgt gac 
thr arg asp 
1531/511 
gtc gag gac 
val glu asp 
1591/531 
gcg get ggt 
ala ala gly 
1651/551 
tea ccg acc 
ser pro thr 
1711/571 
cga ate teg 
arg ile ser 
1771/591 
ctg egg gcc 
leu arg ala 
1831/611 
ggc egg ctg 
gly arg leu 



gtg acg 
val thr 

gtg ctg 
val leu 

ctg gtc 
leu val 

gac ggc 
asp gly 

tac acc 
tyr thr 

ctg ttg 
leu leu 

atg teg 
met ser 

cgc aac 
arg asn 

egg ctg 
arg leu 

cac cgc 
his arg 

tat cgc 
tyr arg 

ggc gtc 
gly val 

aca ccc 
thr pro 

gat tec 
asp ser 

ggc ggt 
gly gly 

gcc ggt 
ala gly 



aag teg 
lys ser 

gtg ttg 
val leu 

ggg ccg 
gly pro 

gag ate 
glu ile 

acc gag 
thr glu 

ctg gcc 
leu ala 

egg cgt 
arg arg 

gag gag 
glu glu 

cgc cgc 
arg arg 

gag ccg 
glu pro 

cgc gtc 
arg val 

att cat 
ile his 

gtt egg 
val arg 

ggc ctg 
gly leu 

gag gtc 
glu val 

egg cac 
arg his 



gtg caa age 
val gin ser 

gcc gcc ate 
ala ala ile 

atg egg gta 
met arg val 

gcg gcg gtc 
ala ala val 

gaa ate ggt 
glu ile gly 

ggc gag gaa 
gly glu glu 

age cgt tec 
ser arg ser 

gat ccc gcc 
asp pro ala 

aac age gcc 
asn ser ala 

gtg ccg ctg 
val pro leu 

gac ate gcg 
asp ile ala 

ctg ctt gcc 
leu leu ala 

gtt gcc gcc 
val ala ala 

ggc atg acc 
gly met thr 

acc ccg gat 
thr pro asp 

ggc ate cga 
gly ile arg 



SEQ ID N° 21F (suite 1) 
FIGURE 21F (suite 1) 



FEUILLE DE REItA PLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



86/185 



1861/621 

gtc ggg ctg cgc ggt 
val gly leu arg gly 
1921/641 

ctg ccg eta gec gtg 
leu pro leu ala val 
1981/661 

gcg ate aag ccg ccg 
ala ile lys pro pro 
2041/681 

ate ggg ccg eta cca 
ile gly pro leu pro 
2101/701 

gec gac gtc ccg gee 
ala asp val pro ala 
2161/721 

gag gat agg ttt caa 
glu asp arg phe gin 
2221/741 

ccg ccc gee aaa ccc 
pro pro ala lys pro 
2281/761 

atg etc tec gag atg 
met leu ser glu met 
2341/781 

aag teg gtg tgg gac 
lys ser val trp asp 
2401/801 

tec cgc acg gac tac 
ser arg thr asp tyr 
2461/821 

gcg gtg cct gag gga 
ala val pro glu gly 
2521/841 

ctt cat ccc ggc cga 
leu his pro gly arg 
2581/861 

gee tec ate age age 
ala ser ile ser ser 
2641/881 

agt cag gga ccc aat 
ser gin gly pro asn 



ccg gtg ace ggt gaa 
pro val thr gly glu 

etc gag ggg acg gee 
leu glu gly thr ala 

tgt cct gaa ccc gcg 
cys pro glu pro ala 

ccg gtc acg ttg etc 
pro val thr leu leu 

cag ccg atg cag cag 
gin pro met gin gin 

cag gag ccc aaa caa 
gin glu pro lys gin 

gcg cca ccg gcg ggc 
ala pro pro ala gly 

gtg ggt gac ccg cac 
val gly asp pro his 

cac ggc tgg teg gcg 
his gly trp ser ala 

ggc ctg ccg gtg cgc 
gly leu pro val arg 

ccc gat egg gag cat 
pro asp arg glu his 

gcg ccg egg cac gcg 
ala pro arg his ala 

cat ttc ggc ggc gtg 
his phe gly gly val 

cag caa tga 
gin gin OPA 



1891/631 

cag ggc ace ggc ace 
gin gly thr gly thr 
1951/651 

cca gcg cag ccg cca 
pro ala gin pro pro 
2011/671 

gcg gee gat ccg acg 
ala ala asp pro thr 
2071/691 

ccg cgc cgt acc ccg 
pro arg arg thr pro 
2131/711 

egg egg cgc gag ctg 
arg arg arg glu leu 
2191/731 

ccg ccc gca cca gaa 
pro pro ala pro glu 
2251/751 

ccg gtt gat gac gac 
pro val asp asp asp 
2311/771 

gag ctg gee cac age 
glu leu ala his ser 
2371/791 

gec gec gag gee gcg 
ala ala glu ala ala 
2431/811 

gaa ccc ggg gec egg 
glu pro gly ala arg 
2491/831 

ccg ggt gca gcg eta 
pro gly ala ala leu 
2551/851 

get gcg gta cgc gac 
ala ala val arg asp 
2611/871 

cgc acc ggg egg teg 
arg thr gly arg ser 



acc gee gag gtc tac 
thr ala glu val tyr 

aag ccg egg gta ttt 
lys pro arg val phe 

gac gtt ccc gee gee 
asp val pro ala ala 

ggg tec agt ggc ate 
gly ser ser gly ile 

aaa aca ccc tgg tgg 
lys thr pro trp trp 

ccg cga ccg gcg ccg 
pro arg pro ala pro 

gtc ate tac egg egg 
val ile tyr arg arg 

ccc gat ctg gac tgg 
pro asp leu asp trp 

gac aag ccc gtg cag 
asp lys pro val gin 

tta gtg ccg ggg gcg 
leu val pro gly ala 

gca tec aac ggc gga 
ala ser asn gly gly 

ccc gac gcg gtt cgt 
pro asp ala val arg 

cat gee cgc gag age 
his ala arg glu ser 



SEQ ID N° 21F (suite 2) 
FIGURE 21F (suite 2) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCI7FR98/01813 

87/185 



31/11 

CTA CGA CAA GGC AAA GGA GCA CAG GGT GAA GCG TGG ACT GAC GGT CGC GGT AGC CGG AGC 
leu arg gin gly lys gly ala gin gly glu ala trp thr asp gly arg gly ser arg ser 
61/^1 91/31 

CGC CAT TCT GGT CGC AGG TCT TTC CGG ATG TTC AAG CAA CAA GTC GAC TAC AGG AAG CGG 

g y 319 S6r Phe ar9 mSt Phe lys gln gln val as P tyr arg lys arg 
121/41 151/51 

TGA GAC CAC GAC CGC GGC AGG CAC GAC GGC AAG CCC CGG CGC CGC ATC CGG GCC GAA GGT 

?ow^n P 917 hiS aSP 9ly lyS pro arg arg ar « He arg ala glu gly 

XaX/ol 211/71 

CGT CAT CGA CGG TAA GGA CCA GAA CGT CAC CGG GTC TGT GGT GTG CAC AAC CGC GGC CCC 

a f?,5i S 31:9 arg ° CH 9ly Pr ° glU arg h " 3rg Val Cys gly val his arg gly arg 

241/81 271/91 

CAA TGT CAA CAT CGC GAT CGG CGG GGC GGC GAC CGG CAT TGC CGC CGT GCT CAC CGA CGG 

301/101 Si/"? 313 hlS arg arg 

CAA CCC TCC GGA GGT GAA GTC CGT TGG GCT CGG TAA CGT CAA CGG CGT CAC GCT GGG ATA 

'S?/?£ ser gly gly glu val arg trp aIa arg 0CH arg gln ar * arg his «i- giy He 

361/121 391/131 

CAC GTC GGG CAC CGG ACA GGG TAA CGC TCG GCA ACC AAG GAC GGC AGC CAC TAC AAG ATC 
his val gly his arg thr gly OCH arg ser ala thr lys asp gly ser his tyr lys ile 

SEQ ID N° 22A 
FIGURE 22A 



32/11 
CGT GGA 
arg gly 
92/31 
TCA AGC 
ser ser 
152/51 
AGC CCC 
ser pro 
212/71 
GGG TCT 
gly ser 
272/91 
ACC GGC 
thr gly 
332/111 
GGT AAC 
gly asn 
392/131 



SEQ ID N° 22B 
FIGURE 22B 



TAC GAC 


AAG 


GCA AAG GAG 


CAC 


AGG 


GTG 


AAG 


tyr asp 


lys 


.ala lys glu 


his 


arg 


val 


lys 


62/21 










GCC ATT 


CTG 


GTC GCA GGT 


CTT 


TCC 


GGA 


TGT 


ala ile 


leu 


val ala gly 


leu 


ser 


gly 


cys 


122/41 










GAG ACC 


ACG 


ACC GCG GCA 


GGC 


ACG ACG 


GCA 


glu thr 


thr 


thr ala ala 


gly 


thr 


thr 


ala 


182/61 












GTC ATC 


GAC 


GGT AAG GAC 


CAG 


AAC 


GTC 


ACC 


val ile 


asp 


gly lys asp 


gln 


asn 


val 


thr 


242/81 










AAT GTC 


AAC 


ATC GCG ATC 


GGC 


GGG 


GCG 


GCG 


asn val 


asn 


ile ala ile 


gly gly ala 


ala 


302/101 














AAC CCT 


CCG 


GAG GTG AAG 


TCC 


GTT 


GGG 


CTC 


asn pro 


pro 


glu val lys 


ser 


val 


gly 


leu 


362/121 










ACG TCG 


GGC 


ACC GGA CAG 


GGT 


AAC 


GCT 


CGG 


thr ser 


gly 


thr gly gln 


gly 


asn 


ala 


arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



ACG ACA 


AGG 


CAA AGG 


AGC 


ACA 


thr thr 


arg 


gin 


arg 


ser 


thr 


63/21 












CCA TTC 


TGG 


TCG 


CAG 


GTC 


TTT 


pro phe 


trp 


ser 


gin val 


phe 


123/41 












AGA CCA 


CGA 


CCG 


CGG 


CAG 


GCA 


arg pro 


arg 


pro arg gin 


ala 


183/61 












TCA TCG 


ACG 


GTA AGG 


ACC 


AGA 


ser ser 


thr 


val 


arg 


thr 


arg 


243/81 








ATG TCA 


ACA 


TCG 


CGA 


TCG 


GCG 


met ser 


thr 


ser 


arg 


ser 


aid 


303/101 












ACC CTC 


CGG 


AGG 


TGA 


AGT 


CCG 


thr leu 


arg 


arg 


OPA 


ser 


pro 


363/121 












CGT CGG 


GCA 


CCG 


GAC 


AGG 


GTA 


arg arg 


ala 


pro 


asp 


arg 


val 


GCA CAA 


CCG 


CGG 


CCG 


GCA 


ATG 


ala gin 


pro 


arg pro 


ala 


met 


61/21 












CCG TGC 


TCA 


CCG ACG 


GCA 


ACC 


pro cys 


ser 


pro 


thr 


ala 


thr 


121/41 












GCG TCA 


CGC 


TGG 


GAT ACA 


CGT 


ala ser 


arg 


trp asp 


thr 


ara 


181/61 












GCA GCC 


ACT 


ACA AGA TCA 


CAG 


ala ala 


thr 


thr 


arg 


ser 


gin 


241/81 










CAT TCT 


GGT 


CGC AGG 


TCT 


TTC 


his ser 


gly 


arg 


arg 


ser 


phe 


301/101 










GAC CAC 


GAC 


CGC 


GGC 


AGG 


CAC 


asp his 


asp 


arg gly arg 


his 


361/121 












ATC GAC 


GGT 


AAG 


GAC 


CAG 


AAC 


ile asp 


gly 


lys asp gin 


asn 


421/141 












GTC AAC 


ATC 


GCG 


ATC 


GGC 


GGG 


val asn 


ile 


ala 


ile gly 


gly 


481/161 












CCT CCG 


GAG 


GTG 


AAG 


TCC 


GTT 


pro pro 


glu 


val 


lys 


ser 


val 


541/181 










TCG GGC 


ACC 


GGA 


CAG 


GGT 


AAC 


ser gly 


thr 


gly gin gly 


asn 



88/185 



33/11 

GGG TGA AGC GTG GAC TGA 
gly OPA ser val asp OPA 
93/31 

CCG GAT GTT CAA GCA ACA 
pro asp val gin ala thr 

153/51 
CGA CGG CAA GCC CCG GCG 
arg arg gin ala pro ala 

213/71 
ACG TCA CCG GGT CTG TGG 
thr ser pro gly leu trp 

273/91 
GGG CGG CGA CCG GCA TTG 
gly arg arg pro ala leu 

333/111 
TTG GGC TCG GTA ACG TCA 
leu gly ser val thr ser 

393/131 
ACG CTC GGC AAC CAA GGA 
thr leu gly asn gin gly 

SEQ ID N° 22C 
FIGURE 22C 







31/11 




TCA ACA 


TCG 


CGA TCG 


GCG 


ser thr 


ser 


arg ser 


ala 






91/31 




CTC CGG 


AGG 


TGA AGT 


CCG 


leu arg 


arg 


OPA ser 


pro 






151/51 




CGG GCA 


CCG 


GAC AGG 


GTA 


arg ala 


pro 


asp arg 


val 






211/71 




GGT GAA 


GCG 


TGG ACT 


GAC 


gly glu 


ala 


trp thr 


asp 






271/91 




CGG ATG 


TTC 


AAG CAA 


CAA 


arg met 


phe 


lys gin gin 






331/111 




GAC GGC 


AAG 


CCC CGG 


CGC 


asp gly 


lys 


pro arg 


arg 






391/131 




GTC ACC 


GGC 


TCC GTG 


GTG 


val thr 


gly 


ser val 


val 






451/151 




GCG GCG 


ACC 


GGC ATT 


GCC 


ala ala 


thr 


gly ile 


ala 






511/171 




GGG CTC 


GGT 


AAC GTC 


AAC 


gly leu 


gly 


asn val 


asn 






571/191 




GCC TCG 


GCA 


ACC AAG 


GAC 


ala ser 


ala 


thr lys 


asp 



SEQ ID N° 23A 



CGG 
arg 


TCG CGG TAG 
ser arg AMB 


CCG 
pro 


GAG 
glu 


CCG 
pro 


AGT 
ser 


CGA CTA CAG 
arg leu gin 


GAA 
glu 


GCG 
ala 


GTG 
val 


CCG 
pro 


CAT CCG GGC 
his pro gly 


CGA 
arg 


AGG 
arg 


TCG 
ser 


TGT 
cys 


GCA CAA CCG 
ala gin pro 


CGG 
arg 


CCG 
pro 


GCA 
ala 


CCG 
pro 


CCG TGC TCA 
pro cys ser 


CCG 
pro 


ACG 
thr 


GCA 
ala 


ACG 
thr 


GCG TCA CGC 
ala ser arg 


TGG 
trp 


GAT 
asp 


ACA 
thr 


CGG 
arg 


CAG CCA CTA 
ril n nro 1 pn 

VjXll ^JL\J XCU 


CAA 
gin 


GAT 
asp 


C 


GGG 
gly 


CGG CGA CCG 
arg arg pro 


GCA 
ala 


TTG 
leu 


CCG 
pro 


TTG 
leu 


GGC TCG GTA 
gly ser val 


ACG 
thr 


TCA 
ser 


ACG 
thr 


ACG 
thr 


CCT CGG CAA 
pro arg gin 


CCA 
pro 


AGG 
arg 


ACG 
thr 


GGT 
gly 


CGC GGT AGC 
arg gly ser 


CGG 
arg 


AGC 
ser 


CGC 
arg 


GTC 
val 


GAC TAC AGG 
asp tyr arg 


AAG 
lys 


CGG 
arg 


TGA 
OPA 


CGC 
arg 


TCC GGG CCG 
ser gly pro 


AAG 
lys 


GTC 
val 


GTC 
val 


TGC 
cys 


ACA ACC GCG 
thr thr ala 


GCC 
ala 


gly 


r\r\ 1 

asn 


GCC 
ala 


GTG CTC ACC 
val leu thr 


GAC 
asp 


GGC 
gly 


AAC 
asn 


GGC 
gly 


GTC ACG CTG 
val thr leu 


GGA 
gly 


TAC 
tyr 


ACG 
thr 


GGC 
gly 


AGC CAC TAC 
ser his tyr 


AAG 
lys 


ATC 
ile 





FEUILLE DE REMFfcftgEiftEglJUEGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CAC AAC 


CGC 


GGC CGG 


CAA 


TGT 


his asn 


ara 


alv ara 


gin 


cys 


62/21 










CGT GCT 


CAC 


CGA CGG 


CAA 


CCC 


arg ala 


his 


ara ara 


gin 


pro 


122/41 










CGT CAC 


GCT 


GGG ATA 


CAC 


GTC 


arg his 


ala 


alv ile 


his 


val 


182/61 










CAG CCA 


CTA 


CAA GAT 


CAC 


AGG 


gin pro 


leu 


aln asD 


his 


arg 


242/81 








ATT CTG 


GTC 


GCA GGT 


CTT 


TCC 


ile leu 


val 


ala alv 


leu 


ser 


302/101 










ACC ACG 


ACC 


GCG GCA 


GGC 


ACG 


thr thr 


thr 


ala ala 


gly 


thr 


362/121 








TCG ACG 


GTA 


AGG ACC 


AGA 


ACG 


ser thr 


val 


arg thr 


arg 


thr 


422/141 










TCA ACA 


TCG 


CGA TCG 


GCG 


GGG 


ser thr 


ser 


arg ser 


ala 


gly 


482/161 








CTC CGG 


AGG 


TGA AGT 


CCG 


TTG 


leu arg 


arg 


OPA ser 


pro 


leu 


542/181 










CGG GCA 


CCG 


GAC AGG 


GTA 


ACG 


arg ala 


pro 


asp arg 


val 


thr 



89/185 









32/11 




CAA 


CAT 


CGC 


GAT CGG 


CGG 


gin 


his 


ara 


asp arg 


arg 








92/31 




TCC 


GGA 


GGT 


GAA GTC 


CGT 


ser 


alv 


alv 


glu val 


arg 








152/51 


GGG 


CAC 


CGG 


ACA GGG 


TAA 


alv 


his 


arg 


thr gly OCH 








212/71 




GTG 


AAG 


CGT 


GGA CTG ACG 


val 


lvs 


ara 


gly leu thr 








272/91 




GGA 


TGT 


TCA 


AGC AAC 


AAG 




cys 


ser 


ser asn 


lys 








332/111 




ACG 


GCA 


AGC 


CCC GGC 


GCC 


thr 


ala 


ser 


pro gly ala 








392/131 




TCA 


CCG 


GCT 


CCG TGG 


TGT 


ser 


pro 


ala 


pro trp 


cys 








452/151 




CGG 


CGA 


CCG 


GCA TTG 


CCG 


arg 


arg 


pro 


ala leu 


pro 








512/171 




GGC 


TCG 


GTA 


ACG TCA 


ACG 


gly 


ser 


val 


thr ser 


thr 








572/191 




CCT 


CGG 


CAA 


CCA AGG 


ACG 


pro 


arg 


gin 


pro arg 


thr 



SEQ ID N° 23B 
FIGURE 23B 



GGC GGC GAC 
gly gly asp 


CGG 
arg 


CAT 
his 


TGC 
cys 


CGC 
arg 


TGG 
trp 


GCT CGG 
ala arg 


TAA 
OCH 


CGT 
arg 


CAA 
gin 


CGG 
arg 


CGC CTC GGC 
arg leu gly 


AAC 
asn 


CAA 
gin 


GGA 
gly 


CGG 
arg 


GTC 
val 


GCG GTA 
ala val 


GCC 
ala 


GGA 
gly 


GCC 
ala 


GCC 
ala 


TCG 
ser 


ACT ACA 
thr thr 


GGA 
gly 


AGC 
ser 


GGT 
gly 


GAG 
glu 


GCT 
ala 


CCG GGC 
pro gly 


CGA 
arg 


AGG 
arg 


TCG 
ser 


TCA 
ser 


GCA CAA CCG 
ala gin pro 


CGG 
arg 


CCG 
pro 


GCA 
ala 


ATG 
met 


CCG 
pro 


TGC TCA 
cys ser 


CCG 
pro 


ACG 
thr 


GCA 
ala 


ACC 
thr 


GCG 
ala 


TCA CGC 
ser arg 


TGG 
trp 


GAT 
asp 


ACA 
thr 


CGT 
arg 


GCA 
ala 


GCC ACT 
ala thr 


ACA 
thr 


AGA 
arg 


TC 





FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



90/185 



ACA ACC 


GCG 


GCC 


GGC 


thr thr 


ala 


ala 


gly 


63/21 






GTG CTC 


ACC 


GAC 


GGC 


val leu 


thr 


asp 


gly 


123/41 








GTC ACG 


CTG 


GGA 


TAC 


val thr 


leu 


gly 


tyr 


183/61 








AGC CAC 


TAC 


AAG 


ATC 


ser his 


tyr 


lys 


ile 


243/81 








TTC TGG 


TCG 


CAG 


GTC 


phe trp 


ser 


gin 


val 


303/101 








CCA CGA 


CCG 


CGG 


CAG 


pro arg 


pro 


arg 


gin 


363/121 








CGA CGG 


TAA 


GGA 


CCA 


arg arg 


OCH 


gly 


pro 


423/141 








CAA CAT 


CGC 


GAT 


CGG 


gin his 


arg 


asp 


arg 


483/161 








TCC GGA 


GGT 


GAA 


GTC 


ser gly 


gly 


glu 


val 


543/181 








GGG CAC 


CGG 


ACA 


GGG 


gly his 


arg 


thr 


gly 



AAT GTC AAC ATC GCG 
asn val asn ile ala 

AAC CCT CCG GAG GTG 
asn pro pro glu val 

ACG TCG GGC ACC GGA 
thr ser gly thr gly 

ACA GGG TGA AGC GTG 
thr gly OPA ser val 

TTT CCG GAT GTT CAA 
phe pro asp val gin 

GCA CGA CGG CAA GCC 
ala arg arg gin ala 

GAA CGT CAC CGG CTC 
glu arg his arg leu 

CGG GGC GGC GAC CGG 
arg gly gly asp arg 

CGT TGG GCT CGG TAA 
arg trp ala arg OCH 

TAA CGC CTC GGC AAC 
OCH arg leu gly asn 



33/11 








ATC GGC 


GGG 


GCG 


GCG 


ile gly gly 


ala 


ala 


93/31 








AAG TCC 


GTT 


GGG 


CTC 


lys ser 


val 


gly leu 


153/51 








CAG GGT 


AAC 






gin gly 


asn 


ala 


ser 


213/71 








GAC TGA 


CGG 


Ten 




asp OPA 


arg 


ser 


arg 


273/91 






GCA ACA AGT 


CGA 


CTA 


ala thr 


ser 


arg 


leu 


333/111 






CCG GCG 


CCG 


CTC 


CGG 


pro ala 


pro 


leu 


arg 


393/131 






CGT GGT 


GTG 


CAC 


AAC 


arg gly val 


his 


asn 


453/151 








CAT TGC 


CGC 


CGT 


GCT 


his cys 


arg 


arg 


ala 


513/171 






CGT CAA 


CGG 


CGT 


CAC 


arg gin arg 


arg 


his 


573/191 






CAA GGA 


CGG 


CAG 


CCA 


gin gly 


arg 


gin pro 



ACC GGC ATT 
thr gly ile 


GCC 
ala 


GCC 
ala 


GGT AAC GTC 
gly asn val 


AAC 
asn 


GGC 
gly 


GCA ACC AAG 
ala thr lys 


GAC 
asp 


GGC 
gly 


TAG CCG CAG 
AMB pro glu 


CCG 
pro 


CCA 
pro 


CAG GAA GCG 
gin glu ala 


GTG 
val 


AGA 
arg 


GCC GAA dCXT 

ala glu gly 


arg 


CAT 

his 


CGC GGC CGG 
arg gly arg 


CAA 
gin 


TGT 
cys 


CAC CGA CGG 
his arg arg 


CAA 
gin 


CCC 
pro 


GCT GGG ATA 
ala gly ile 


CAC 
his 


GTC 
val 


CTA CAA GAT 
leu gin asp 


C 





SEQ ID N' 23C 
FIGURE 23C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



91/185 



CTA ACG 


ACA 


GGC 


leu thr 


thr 


alv 


61/21 






CGC CAT 


TCT 


GGT 


arg his 


ser 


gly 


121/41 






TGA GAC 


CAC 


GAC 


OPA asp 


his 


****** 


181/61 






GTC ATC 


GAC 


GGT 


val ile 


asp 


gly 


241/81 






AAT GTC 


AAC 


ATC 


asn val 


asn 


ile 


301/101 






AAC CCT 


CCG 


GAG 


asn pro 


pro 


glu 


361/121 






ACG TCG 


GGC 


ACC 


thr ser 


gly 


thr 



31/11 
. GCG TGG 
ala trp 
91/31 
TTC AAG 
phe lys 
151/51 
AAG CCC 
lys pro 
211/71 
GGC TCC 
gly ser 
271/91 
ACC GGC 
thr gly 
331/111 
GGT AAC 
gly asn 
391/131 



SEQ ID N° 24A 
FIGURE 24A 



TAA CGA 


CAG 


GCA 


OCH arg 


gin 


ala 


62/21 






GCC ATT 


CTG 


GTC 


ala ile 


leu 


val 


122/41 






GAG ACC 


ACG 


ACC 


glu thr 


thr 


thr 


182/61 






TCA TCG 


ACG 


GTA 


ser ser 


thr 


val 


242/81 






ATG TCA 


ACA 


TCG 


met ser 


thr 


ser 


302/101 






ACC CTC 


CGG 


AGG 


thr leu 


arg 


arg 


362/121 






CGT CGG 


GCA 


CCG 


arg arg 


ala 


pro 



AAG GAG CAC AGG 
lys glu his arg 

GCA GGT CTT TCC 
ala gly leu ser 

GCG GCA GGC ACG 
ala ala gly thr 

AGG ACC AGA ACG 
arg thr arg thr 

CGA TCG GCG GGG 
arg ser ala gly 

TGA AGT CCG TTG 
OPA ser pro leu 

GAC AGG GTA ACG 
asp arg val thr 







32/11 


GTG 


AAG 


CGT GGA 


val 


lys 


arg gly 






92/31 


GGA 


TGT 


TCA AGC 


gly 


cys 


ser ser 






152/51 


ACG 


GCA 


AGC CCC 


thr 


ala 


ser pro 






212/71 


TCA 


CCG 


GCT CCG 


ser 


pro 


ala pro 






272/91 


CGG 


CGA 


CCG GCA 


arg 


arg 


pro ala 






332/111 


GGC 


TCG 


GTA ACG 


gly 


ser 


val thr 






392/131 


CCT 


CGG 


CAA CCA 


pro 


arg 


gin pro 



CTG ACG GTC GCG 
leu thr val ala 

AAC AAG TCG ACT 
asn lys ser thr 

GGC GCC GCT CCG 
gly ala ala pro 

TGG TGT GCA CAA 
trp cys ala gin 

TTG CCG CCG TGC 
leu pro pro cys 

TCA ACG GCG TCA 
ser thr ala ser 

AGG ACG GCA GCC 
arg thr ala ala 



GTA GCC GGA GCC 
val ala gly ala 

ACA GGA AGC GGT 
thr qly ser gly 

GGC CGA AGG TCG 
gly arg arg ser 

CCG CGG CCG GCA 
pro arg pro ala 

TCA CCG ACG GCA 
ser pro thr ala 

CGC TGG GAT ACA 
arg trp asp thr 

ACT ACA AGA TC 
thr thr arg 



SEQ ID N° 24B 



FIGURE 24B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



92/185 



33/11 

AAC GAC AGG CAA AGG AGC ACA GGG TGA AGC GTG GAC 
asn asp arg gin arg ser thr gly OPA ser val asp 
"/21 9 3/31 
CCA TTC TGG TCG CAG GTC TTT CCG GAT GTT CAA GCA 
pro phe trp ser gin val phe pro asp val gin ala 
123/41 153/51 
AGA CCA CGA CCG CGG CAG GCA CGA CGG CAA GCC CCG 
arg pro arg pro arg gin ala arg arg gin ala pro 
183/61 213/71 
CAT CGA CGG TAA GGA CCA GAA CGT CAC CGG CTC CGT 
his arg arg OCH gly pro glu arg his arg leu arg 
243/81 2 73/91 y 

TGT CAA CAT CGC GAT CGG CGG GGC GGC GAC CGG CAT 
cys gin his arg asp arg arg gly qly asp arg his 
303/101 333/111 
CCC TCC GGA GGT GAA GTC CGT TGG GCT CGG TAA CGT 
pro ser gly gly glu val arg trp ala arg OCH arq 
363/121 393/131 



TAG 
AMB 


CCG 
pro 


GAG CCG 
glu pro 


CAG 
gin 


GAA 
glu 


GCG GTG 
ala val 


GCC 
aia 


GAA 
glu 


GGT CGT 
gly arg 


CGC 
arg 


GGC 
gly 


CGG CAA 
arg gin 


CAC 
his 


CGA 
arg 


CGG CAA 
arg gin 


GCT 
ala 


GGG 
gly 


ATA CAC 
ile his 


CTA 
leu 


CAA 
gin 


GAT C 
asp 



SEQ ID N° 24C 
FIGURE 24C 

Amorce directe 
5' ACG CGG CGC AGC CTG TTG 3' 

SEQ ID N° 25 
FIGURE 25 

Amorce inverse 
5' CGA CCT TGG GAT TCG CCT 3' 

SEQ ID N° 26 
FIGURE 26 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CCT ACC 


AGC 


AAG 


pro thr 


ser 


lys 


61/21 






TCC AAT 


TTT 


CCT 


ser asn 


phe 


pro 


121/41 






CGG TCG 


CGC 


AGC 


arg ser 


arg 


ser 


181/61 






GTC GTC 


GCT 


CTC 


val val 


ala 


leu 


241/81 






TCG GCT 


GAG 


TGT 


ser ala 


glu 


cys 


301/101 






AAG TCC 


CCC 


CCG 


lys ser 


pro 


pro 


361/121 






CTC ATT 


TCG 


CAG 


leu ile 


ser 


gin 


421/141 






GTC GGA 


CGA 


GTC 


val gly 


arg 


val 



AGC CCA GGG CTT 
ser pro gly leu 

TCC GCC CCG TGC 
ser ala pro cys 

TTG CGG AAA CGG 
leu arg lys arg 

CAC CCG TCG GGG 
his pro ser gly 

CTG CAG GGC TCC 
leu gin gly ser 

CGC GAC TTC CAG 
arg asp phe gin 

CAA GCG GTC TCC 
gin ala val ser 

GTC GTC AAC GAC 
val val asn asp 



93/185 







31/11 


CAC 


AGG 


ACC TAA 


his 


ara 


thr OCH 






91/31 


AAT 


ACC 


ATC TGC" 


asn 


thr 


ile cys 






151/51 


GGT 


ATG 


GAP CCT 


crlv 


met 








211/71 


GGC 


GAA 


AGC CAT 


gly 


glu 


ser his 






271/91 


GGG 


vxtVVj 


t-Ab CCG 


gly 


alu 








331/111 


ACA 


TTT 


GTT GTG 


thr 


phe 


val val 






391/131 


GGG 


TCG 


CAG CAT 


gly 


ser 


gin his 


CAC 


GAT 


C 


his 


asp 





AAG GAG TAG CGC 
lys glu AMB arg 

AAG ACC AGC GAC 
lys thr ser asp 

GCC GTA CCG TTG 
ala val pro leu 

TCC GAC ACT GGG 
ser asp thr gly 

ATC ATC ACC ATG 
ile ile thr met 

GTT TCG GTT GAG 
val ser val glu 

CGT TGC GGC GAT 
arg cys gly asp 



CCA TGG GCT TGA 
pro trp ala OPA 

GGC CCG TGG TTG 
gly pro trp leu 

TTG CCA CTT GAT 
leu pro leu asp 

ATC CTC AAA ACG 
ile leu lys thr 

TAC GAA CTG AAT 
tyr glu leu asn 

GCC GAG GCG AGG 
ala glu ala arg 

CGC GGC GCA GTC 
arg gly ala val 



SEQ ID N° 27A 
FIGURE 27A 



CTA CCA 


GCA 


AGA 


GCC 


CAG 


GGC 


leu pro 


ala 


arg 


ala 


gin gly 


61/21 












CCA ATT 


TTC 


CTT 


CCG 


CCC 


CGT 


pro ile 


phe 


leu 


pro 


pro 


arg 


121/41 










GGT CGC 


GCA 


GCT 


TGC 


GGA 


AAC 


gly arg 


ala 


ala 


cys 


gly asn 


181/61 












TCG TCG 


CTC 


TCC 


ACC 


CGT 


CGG 


ser ser 


leu 


ser 


thr 


arg 


arg 


241/81 










CGG CTG 


AGT 


GTC 


TGC 


AGG 


GCT 


arg leu 


ser 


val 


cys 


arg 


ala 


301/101 












AGT CCC 


CCC 


CGC 


GCG 


ACT 


TCC 


ser pro 


pro 


arg 


ala 


thr 


ser 


361/121 










TCA TTT 


CGC 


AGC 


AAG 


CGG 


TCT 


ser phe 


arg 


ser 


lys 


arg 


ser 


421/141 












TCG GAC 


GAG 


TCG 


TCG 


TCA ACG 


ser asp 


glu 


ser 


ser 


ser 


thr 



31/11 



TTC ACA 


GGA 


CCT AAA 


AGG 


phe thr 


gly pro lys 


arg 






91/31 


GCA ATA 


CCA 


TCT GCA 


AGA 


ala ile 


pro 


ser ala 


arg 






151/51 


GGG GTA 


TGG ACC CTG 


CCG 


gly val 


trp 


thr leu 


pro 






211/71 


GGG GCG 


AAA GCC ATT 


CCG 


gly ala 


lys 


ala ile 


pro 






271/91 




CCG GGG 


AGC 


AGC CGA 


TCA 


pro gly 


ser 


ser arg 


ser 






331/111 




AGA CAT 


TTG 


TTG TGG 


TTT 


arg his 


leu 


leu trp 


phe 






391/131 




CCG GGT 


CGC 


AGC ATC 


GTT 


pro gly 


arg 


ser ile 


val 


ACC ACG 


ATC 






thr thr 


ile 







SEQ ID N° 27B 



AGT AGC GCC CAT GGG CTT GAT 
ser ser ala his gly leu asp 

CCA GCG ACG GCC CGT GGT TGC 
pro ala thr ala arg gly cys 

TAC CGT TGT TGC CAC TTG ATG 
tyr arg cys cys his. leu met 

ACA CTG GGA TCC TCA AAA CGT 
thr leu gly ser ser lys arg 

TCA CCA TGT ACG AAC TGA ATA 
ser pro cys thr asn OPA ile 

CGG TTG AGG CCG AGG CGA GGC 
arg leu arg pro arg arg gly 

GCG GCG ATC GCG GCG CAG TCG 
ala ala ile ala ala gin ser 



FEUILLE DE REM^ggJflE^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



94/185 



TAC CAG 


CAA 


GAG 


CCC 


tyr gin 


gin 


glu 


pro 


63/21 








CAA TTT 


TCC 


TTC 


CGC 


gin phe 


ser 


phe 


arg 


123/41 






GTC GCG 


CAG 


CTT 


GCG 


val ala 


gin 


leu 


ala 


183/61 








CGT CGC 


TCT 


CCA 


CCC 


arg arg 


ser 


pro 


pro 


243/81 








GGC TGA 


GTG 


TCT 


GCA 


gly OPA 


val 


ser 


ala 


303/101 








GTC CCC 


CCC 


GCG 


CGA 


val pro 


pro 


ala 


arg 


363/121 






CAT TTC 


GCA 


GCA 


AGC 


his phe 


ala 


ala 


ser 


423/141 








CGG ACG 


AGT 


CGT 


CGT 


arg thr 


ser 


arg 


arg 



33/11 
CTA AAA 
leu lys 
93/31 
CTG CAA 
leu gin 
153/51 
CCC TGC 
pro cys 
213/71 
CCA TTC 
pro phe 
273/91 
GCC GAT 
ala asp 
333/111 
TGT GGT 
cys gly 
393/131 



SEQ ID N° 27C 
FIGURE 27C 



MKT GTATTRRRLLAVLIALALPGAAVALLAEPSATGAS D PCAAS EVAR 
TVGSV7VKSMGDYLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPK 
V7VSDLHALSQPLTDLSTRCSLPI SGLQAIGLMQAVQGARR 



SEQ ID N° 28 
FIGURE 28 



GTGGGCAAGC AGCTAGCCGC GCTCGCCGCG CTGGTCGGTG CGTGCATGCT CGCAGCCGGA 60 

TGCACCAACG TGGTCGACGG GACCGCCGTG GCTGCCGACA AATCCGGACC ACTGCATCAG 120 

GATCCGATAC CGGTTTCAGC GCTTGAAGGG CTGCTTCTCG ACTTGAGCCA GATCAATGCC 180 

GCGCTGGGTG CGACATCGAT GAAGGTGTGG TTCAACGCCA AGGCAATGTG GGACTGGAGC 240 

AAGAGCGTGG CCGACAAGAA TTGCCTGGCT ATCGACGGTC CAGCACAGGA AAAGGTCTAT 300 

GCCGGCACCG GGTGGACCGC TATGCGCGGC CAACGGCTGG ATGACAGCAT CGATGACTCC 360 

AAGAAACGCG ACCACTACGC CATTCAAGCG GTCGTCGGCT TCCCGACCGC ACATGATGCC 420 

GAGGAGTTCT ACAGCTCCTC GGTGCAAAGC TGGAGCAGCT GCTCGAACCG CCGGTTTGTC 480 

GAAGTCACCC CCGGACAGGA CGACGCCGCC TGGACTGTGG CTGACGTTGT CAACGACAAC 540 

GGCATGCTCA GTAGCTCGCA GGTTCAGGAA GGCGGCGACG GATGGACCTG CCAGCGTGCC 600 

CTGACTGCGC GCAACAACGT CACTATCGAC ATTGTCACGT GCGCCTATAG CCAACCGGAT 660 

TTGGTGGCGA TTGGCATCGC TAACCAAATC GCGGCCAAGG TTGCTAAGCA GTAG 714 



SEQ ID N° 29 
FEUILLE DE REMPCA6BMEWP(RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



95/185 



MKVWFNAKAMWDWSKSVADKNCIiAI DGPAQEKVYAGTGETWTAMRGQRLDDS I DDSKKRDHYAIQAW 



SEQ ID N° 30 
FIGURE 30 



31/11 

AGG CGA ATA CCC GCG AGG GCA GCG CGA CGG CGG CCC TGC CGG CGC CGT GGC TGC TGA ACA 
a^arg lie pro ala arg ala ala arg arg arg^ro cys arg arg arg SJ cys £ 

ACA. CAT CCC AGC CGC GCA CGC TTC CGG TAT GCG GCA GGA TAA ACG'ACC CCA ACA GCA CGA 
m/5t S . S " " 9 ar9 - tyr SJ,;^ ° CH ^ ^ i£ 5 art 

ACA CCA GGA TTG CGA CAA CCA AAG CCC TCG CGC CTG GCT CGA TTT CGC GCG CAA CGC GGC 
thr /D ro gly leu~arg gin pro lys pro ser ar^leu ala arg phe a ? q £ g^ arg g!y 

GTT CTG CCG CCT CGA TCT CAG CGC GGA GGG CGT CGA GAT C 
val leu pro pro arg ser gin arg gly gly arg arg asp 

SEQ ID N° 31A 
FIGURE 31A 



1 { 1 31/11 

GGC GAA TAC CCG CGA GGG CAG CGC GAC GGC GGC CCT GCC GGC GCC GTG GCT GCT GAA CAA 
gly glu tyr pro arg gly gin arg asp gly g l y pro ala gly ala £ J" 
ox/^x 91/31 

CAC ATC CCA GCC GCG CAC GCT TCC GGT ATG CGG CAG GAT AAA CGA CCC CAA CAG CAC GAA 
SS/S" Pr ° ala 9ly 111*]" *** Pro g^ £n £s gtu" 

Ss Sn SI If ™ C °^ AG ° CCT CGC ™ G CTC GAT TTC G <* CGC AAC GCG GCG 

Ml/61 P 3311 9 Pt ° a } a /^ P l6U 3SP Phe ala "9 asn ala ala 

TTC TGC CGC CTC GAT CTC AGC GCG GAG GGC GTC GAG ATC 
phe cys arg leu asp leu ser ala glu gly val glu ile 

SEQ ID N° 31B 
FIGURE 31B 



FEUILLE DE REPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



96/185 

1/1 31/11 

GCG AAT ACC CGC GAG GGC AGC GCG ACG GCG GCC CTG CCG GCG CCG TGG CTG CTG AAC AAC 
ala^n thr arg glu gly ser ala thr ala ala^leu pro ala pro trp leu leu «n 

ACA TCC CAG CCG CGC ACG CTT CCG GTA TGC GGC AGG ATA AAC GAC CCC AAC AGC ACG AAC 
thr^aer gin pro arg thr leu pro val cys gly^rg lie a 9 n asp pro asn ser ttr ™ 

ACC AGG ATT GCG ACA ACC AAA GCC CTC GCG CCT GGC TCG ATT TCG CGC GCA ACG CGG CGT 
JS/S" ^ 3Cr Ue S « ar * S S art Z 

TCT GCC GCC TCG ATC TCA GCG CGG AGG GCG TCG AGA TC 
ser ala ala ser ile ser ala arg arg ala ser arg 

SEQ ID N° 31C 
FIGURE 31C 

ORF d'apres Cole et al. (Nature 393:537-544) et contenant seq31A 
1/1 31/11 
taa acg acc cca aca gca cga aca cca gga ttg cga 
OCH thr thr pro thr ala arg thr pro gly leu arg 
61/21 91/31 
cga ttt cgc gcg caa cgc ggc gtt ctg ccg cct cga 
arg phe arg ala gin arg gly val leu pro pro arq 
121/41 151/51 * 
ccc egg cgt cgt gtt cgt ggc tea tea tct gca~ tec 
pro arg arg arg val arg gly ser ser ser ala ser 
181/61 211/71 
cag ccc gac ccc agg cat gee cag gee gac ggc gcg . 
gin pro asp pro arg his ala gin ala asp gly ala ; 
241/81 271/91 
gtc gee ggc gcg ggt gcg gcg gtg ggt cag gac gec . 
val ala gly ala gly ala ala val gly gin asp ala < 
301/101 331/111 
cgc cgc ttc ggt gac ctt cgt ggt gat gac gtc gec i 
arg arg phe gly asp leu arg gly asp asp val ala < 
361/121 391/131 
ggt gaa gtg cac cag gcg ccc gtc gcg cgc ccg ccc < 
gly glu val his gin ala pro val ala arg pro pro , 
421/141 451/151 
ctt gcg ccc ttc ccc ggt ggc cac cag cac etc gac * 
leu ala pro phe pro gly gly his gin his leu asp < 
481/161 511/171 
ggc ttc cag cga gat ttg etc ctg cag cgc gat cag < 
gly phe gin arg asp leu leu leu gin arg asp gin < 
541/181 571/191 
ggc ttt egg cag ctg tec gtc gag ttg cgc ggc egg 1 
gly phe arg gin leu ser val glu leu arg gly arg < 
601/201 631/211 
gaa ggt aaa tgc ggc cgc gaa gcg ggc ccg gcg cac < 
glu gly lys cys gly arg glu ala gly pro ala his 1 
661/221 691/231 
etc ttc ggt etc ccc ggg gaa acc gac gat cag ate < 
leu phe gly leu pro gly glu thr asp asp gin ile < 
721/241 751/251 
ggc cgc ccg cac gcg etc gat gat gee gag gta gcg < 
gly arg pro his ala leu asp asp ala glu val ala ] 
781/261 811/271 
cgc gcg cag gat ccg gtc gga tec gga ctg tag 
arg ala gin asp pro val gly ser gly leu AMB 

SEQ ID N° 31F 



cca 
pro 


■ aag 
lys 


ccc 
pro 


teg cgc ctg get 
ser arg leu ala 


cag 
gin 


cac 
arg 


aaa 
gly 


yyy cgc cga gat 
gly arg arg asp 


ggg 

gly 


ctt 
leu 


ggc 

gly 


cgc get gac egg 
arg ala asp arg 


egg 
arg 


ctg 
leu 


ccc 
pro 


ggc ggt gtg cgc 
gly gly val arg 


gtc 
val 


ggc 

gly 


gat 
asp 


gag gtg gtg egg 
glu val val arg 


acg 
thr 


cac 
his 


gcg 
ala 


egg ctg gec ggc 
arg leu ala gly 


cat 
his 


gcg 
ala 


cgc 
arg 


cgt gac ggt gtc 
arg asp gly val 


ctg 
leu 


ccc 
pro 


gac 
asp 


cag ggc gcg gtt 
gin gly ala val 


ttc 
phe 


ata 
ile 


gcg 
ala 


ttc ctg cac aac 
phe leu his asn 


ccc 
pro 


ggg 

gly 


ccg 
pro 


ctt gga gta ttg 
leu gly val leu 


gtc 
val 


gag 
glu 


cgt 
arg 


ggc cgc gaa gtc 
gly arg glu val 


ggt 
gly 


aat 
asn 


cgc 
arg 


ggc atg egg gat 
gly met arg asp 


ggc 
gly 


acg 
thr 


ata 
ile 


gga ccg ccg cat 
gly pro pro his 



FEUILLE DE REMPEfitJEfilEWlF(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



97/185 



i' 1 31/11 

aga ctg gtg tac acg gag acc aag ctg aac teg gca ttc tec ttc ggc ggg cct aag tgt 
arg^leu val tyr thr glu thr lys leu asn ser^ala phe ser phe gly gly pro ly * ■ 

eta gtg aag gtc att cag aaa ctg teg ggc ttg age ate aac egg ttc ate gcg att gac 

leu val lys val He gin lys leu ser gly leu ser ile asn arg phe ile ala ile asp 

121/41 151/51 F 

ttc gtc ggt ttc gcg egg atg gtc gag gee etc ggc ggc gtc gag gta tgc age acc acc 

phe val gly phe ala arg met val glu ala leu gly gly val glu val cys ser thr thr 

181/61 211/71 

ecg ttg egg gac tac gaa ctg ggc acg gtg ctg gag cac gee gga cge cag gtc att gac 

Ei/ir arg asp yr 9 9 y thr val lTi/ti u his ala 9ly arg gl * * al ile * sp 

ggg ecg acc gcg ctg aac tat gtg cgc get cge cag gtc acc acc gag age aat ggc gac 

!Ji/iS asn tyr val arg ala ;g,S; val thr thr glu s " asn 5y K 

tac ggg cgc ate aaa cgc cag cag ttg ttt ttg teg teg ctg ctg cgt teg atg ate 
tyr gly arg He lys arg gin gin leu phe leu ser ser leu leu arg ser met ile 



SEQ ID N° 32A 
FIGURE 32A 



1/1 

gac tgg tgt aca egg 
asp trp cys thr arg 
61/21 

tag tga agg tea ttc 
AMB OPA arg ser phe 
121/41 

teg teg gtt teg cgc 
ser ser val ser arg 
181/61 

cgt tgc ggg act acg 
arg cys gly thr thr 
241/81 

ggc cga ecg cgc tga 
gly arg pro arg OPA 
301/101 

acg ggc gca tea aac 
thr gly ala ser asn 



aga cca age tga act 
arg pro ser OPA thr 

aga aac tgt egg get 
arg asn cys arg ala 

gga tgg teg agg ccc 
gly trp ser arg pro 

aac tgg gca egg tgc 
asn trp ala arg cys 

act atg tgc gcg etc 
thr met cys ala leu 

gee age agt tgt ttt 
ala ser ser cys phe 



31/11 



egg cat 


tct 


cct 


teg 


arg his 


ser 


pro 


ser 


91/31 






tga gca 


tea 


acc 


ggt 


OPA ala 


ser 


thr 


gly 


151/51 






teg gcg 


gcg 


teg 


agg 


ser ala 


ala 


ser 


arg 


211/71 






tgg age 


acg 


ecg 


gac 


trp ser 


thr 


pro 


asp 


271/91 






gee agg 


tea 


cca 


ecg 


ala arg 


ser 


pro 


pro 


331/111 








tgt cgt 


cgc tgc 


tgc 


cys arg 


arg 


cys 


cys 



gcg ggc eta agt gtc 
ala gly leu ser val 

tea teg cga ttg act 
ser ser arg leu thr 

tat gca gca cca ccc 
tyr ala ala pro pro 

gee agg tea. ttg acg 
ala arg ser leu thr 

aga gca atg gcg act 
arg ala met ala thr 

gtt cga tga tc 
val arg OPA 



SEQ ID N° 32B 



FIGURE 32B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



98/185 



1/1 






act ggt 


gta 


cac 


thr gly 


val 


his 


61/21 






agt gaa 


ggt 


cat 


ser glu 


gly 


his 


121/41 






cgt egg 


ttt 


cgc 


arg arg 


phe 


arg 


181/61 






gtt gcg 


gga 


eta 


val ala 


gly 


leu 


241/81 






gec gac 


cgc 


get 


aia asp 


arg 


ala 


301/101 






egg gcg 


cat 


caa 


arg ala 


his 


gin 



gga gac caa get 
gly asp gin ala 

tea gaa act gtc 
ser glu thr val 

gcg gat ggt cga 
ala asp gly arg 

cga act ggg cac 
arg thr gly his 

gaa eta tgt gcg 
glu leu cys ala 

acg cca gca gtt 
thr pro ala val 



31/11 
gaa etc ggc att 
glu leu gly ile 

91/31 
ggg ctt gag cat 
gly leu glu his 

151/51 
ggc cct egg egg 
gly pro arg arg 

211/71 
ggt get gga gca 
gly ala gly ala 

271/91 
cgc teg cca ggt 
arg ser pro gly 

331/111 
gtt ttt gtc gtc 
val phe val val 



etc ctt egg egg 
leu leu arg arg 

caa ccg gtt cat 
gin pro val his 

cgt cga ggt atg 
arg arg gly met 

cgc egg acg cca 
arg arg thr pro 

cac cac cga gag 
his his arg glu 

get get gcg ttc 
ala ala ala phe 



gee 
ala 


taa gtg 
OCH val 


tct 
ser 


cgc 
arg 


gat tga 
asp OPA 


ctt 
leu 


cag 
gin 


cac cac 
his his 


ccc 
pro 


ggt 
gly 


cat tga 
his OPA 


egg 
arg 


caa 
gin 


tgg cga 
trp arg 


eta 
leu 


gat 
asp 


gat c 
asp 





SEQ ID N° 32C 
FIGURE 32C 



sequence Rv0822c predite par Cole et al. 



(Nature 393:537-544) et contenant seq 32A 



etc 
leu 


tec 
ser 


gag 
glu 


tea 
ser 


gca 
ala 


ttc 
phe 


ccc 
pro 


gat 
asp 


tgg 
trp 


gtg 
val 


gca 
ala 


gec 
ala 


cag 
gin 


ggt 
gly 


ccg 
pro 


egg 
arg 


gtt 
val 


agt gtg 
ser val 


gee 
ala 


gat 
asp 


ctg 
leu 


ate 
ile 


gec 
ala 


cgc 
arg 


cat 
his 


gtc 
val 


gee 
ala 


ccc 
pro 


gaa 
glu 


ccc 
pro 


gag 
glu 


gac 
asp 


gac 
asp 


cag 
gin 


cag 
gin 


gac 
asp 


ace 
thr 


gag 
glu 


get 
ala 


gag 
glu 


ctt 
leu 


ccc 
pro 


gac 
asp 


etc 
leu 


egg 
arg 


gca 
ala 


gec 
ala 


gag 
glu 


eta 
leu 


ccc 
pro 


ggc 
gly 


aag 
lys 


cag 
gin 


eta 
leu 


acc 
thr 


acg 
thr 


teg 
ser 


ccc 
pro 


gcg 
ala 


ccc 
pro 


gee 
ala 


aag 
lys 


cca 
pro 


gcg 
ala 


cgc 
arg 


teg 
ser 


ctg 
leu 


gcg 
ala 


get 
ala 


ctg 
leu 


ttt 
phe 


cag 
gin 


tgg 
trp 


age 
ser 


gcg 
ala 


teg 
ser 


aag 
lys 


aac 
asn 


age 
ser 


ggc 
gly 


gac 
asp 


ate 
ile 


gtc 
val 


aac 
asn 


ccc 
pro 


age 
ser 


ggg 

gly 



1/1 




atg agt 


gac 


Met ser 


asp 


61/21 




ggt gtt 


gac 


gly val 


asp 


121/41 




gac ace 


cag 


asp thr 


gin 


181/61 




agg etc 


ggc 


arg leu 


gly 


241/81 




cca tec 


ggc 


pro ser 


gly 


301/101 




ate gec 


ate 


ile ala 


ile 


361/121 




aac tat 


ccg 


asn tyr 


pro 


421/141 




gga teg 


get 


gly ser 


ala 


481/161 




gcg ccg 


aac 


ala pro 


asn 


541/181 




gee get 


ctg 


ala ala 


leu 


601/201 




egg ctg 


aac 


arg leu 


asn 



ggc 
gly 


gag 
glu 


age 
ser 


cga 
arg 


tgg 
trp 


ate 
ile 


aat 
asn 


gtc 
val 


ggc 
gly 


ccc 
pro 


get 
ala 


ttt 
phe 


cgc 
arg 


ggc 
gly 


ccg 
pro 


ccg 
pro 


gec 
ala 


cac 
his 


cgc 
arg 


gec 
ala 


gac 
asp 


cga 
arg 


gtg 
val 


egg 
arg 


tec 
ser 


ggc 
gly 


egg 
arg 


gcg 
ala 


ttg 
leu 


gcg 
ala 


atg 
met 


gta 
val 


age 
ser 



gee gcg ccg 
ala ala pro 

acg gta ccg 
thr val pro 

tgt cat gec 
cys his ala 

cct gac etc 
pro asp leu 

aag gtc cac 
lys val his 

teg etc gag 
ser leu glu 

cac gee cgc 
his ala arg 

cca ttg egg 
pro leu arg 

cgc ccg atg 
arg pro met 

ctg acc ggc 
leu thr gly 

gcg etc gac 
ala leu asp 





31/11 


tgg 


gca egg 


trp 


ala arg 




91/31 


ccc 


gec aca 


pro 


ala thr 




151/51 


acc 


ggc gee 


thr 


gly ala 




211/71 


ccc 


acg cac 


pro 


thr his 




271/91 


gac 


gac gee 


asp 


asp ala 




331/111 


ttc 


etc teg 


phe 


leu ser 




391/131 


cgt 


gaa ccc 


arg 


glu pro 




451/151 


ate 


cgc cga 


ile 


arg arg 




511/171 


gtg 


ctg gee 


val 


leu ala 




571/191 


ggg 


gca tgg 


gly 


ala trp 




631/211 


ccg 


cat teg 


pro 


his ser 



SEQ ID N° 32D 



FEUILLE DE REMp££S§filEiW[REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



99/185 



661/221 691/231 

cag cat ggc gac gag aac ttc ttg etc gtc ggt atg gac tct cgt gec ggg gcq aac occ 
gin his gly asp glu asn phe leu leu val gly met asp ser arg ala gly ala asn ala 
721/241 751/251 

aat ate ggc gec ggc gac gee gag gac gee ggc ggc gca cgt teg gac ace gtc atg eta 
asn ile gly ala gly asp ala glu asp ala gly gly ala arg ser asp thr val met leu 
781/261 811/271 

gtc aac att ccg gee age cgc gag egg gtc gtc gcg gtg teg ttc ccc cgc gac ctg gca 

H!i,SI? ile Pr ° ala 3Gr 9lU arg Val val ala val 3er P he P ro a *9 asp leu ala 
841/281 871/291 

ate act cca ate caa tgc gag gcg tgg aac ccc gag ace ggt aag tac gga ccc ate tac 

901/301 ^ Pr<> 9lU 9ly ly3 tyr 9ly Pr ° ile tyr 

gac gag aag acg gga acg atg ggt ccc aga ctg gtg tac acg gag acc aag ctg aac tea 

^?,?i U lyS 9ly ^ met gly pro ara leu val tvr fc hr thr lys leu asn ser 
961/321 991/331 

gca ttc tec ttc ggc ggg cct aag tgt eta gtg aag gtc att cag aaa ctg teg ggc ttg 

fi?,E!, S8r P 9 Y 9ly Pr ° lyS CyS lGU Val lys val Ue oln ^ le u ^r gly leu 
1021/341 1051/351 

age ate aac egg ttc ate gcg att gac ttc gtc ggt ttc gcg egg atg gtc gag gee etc 

f«f.^!n a3n arg Phe ile ala ile a3p phe val aly P he ala ar * met val glu ala leu 
1081/361 1111/371 

ggc ggc gtc gag gta tgc age acc acc ccg ttg egg gac tac gaa ctg ggc acg gtg ctg 

?^,£L Val 9lU Val ° y3 3er thr thr pro leu ar * as P tyr glu leu gly thr val leu 
1141/381 1171/391 

gag cac gec gga cgc cag gtc att gac ggg ccg acc gcg ctg aac tat gtg cgc get cgc 

ala gly 3X9 gln Val ile a3p aly P ro thr ala leu tyr val arg ala arg 
1201/401 1231/411 9 

cag gtc acc acc gag age aat ggc gac tac ggg cgc ate aaa cgc cag cag ttg ttt ttg 

?ic^i, thr thr glU 3er a3n gly a3p tyr gly ar * ile lys arg gin gin leu phe leu 
1261/421 1291/431 

teg teg ctg ctg cgt teg atg ate teg acg gac acc ttg ttc aac etc age agg etc aac 

ser ser leu leu arg ser met ile ser thr asp thr leu phe asn leu ser arg leu asn 
1321/441 1351/451 

aac gtc gtc aac atg ttc ate ggt aac age tac gtg gac aac gtc aag acc aaa gac ctg 

Val a3n met Phe Ue gly a3n ser tyr val as P asn va * thr lys asp leu 

1381/461 1411/471 

gtc gaa etc ggt cga teg ttg cag cat atg gcg gec ggg cac gtc acg ttc gtg acc gtt 

Y!i,E« ltU 9ly arg 3er leU gln met ala ala gly his val thr phe val thr val 
1441/481 1471/491 

ccg acc ggt ata acc gac cag aac ggc gac gag ccc ccg cgt acc tec gac atg aag gcg 

?f^^f, gly ile **** a3p gln Mn gly a3 P alu P ro P ro ara thr ser asp met lys ala 
1501/501 1531/511 

ctt ttc acc gee ate ate gac gac gat ccg ctg ccc ctg gaa aac gat cac aac gee cag 

Te«??!, Ue ile a3p a3p a3p pro leu pro leu « lu asn a3 P hi3 a *n ala gln 

1561/521 1591/531 

cgt ctg ggc aac acg ccg teg acc ccg ccg acc acc acc aag aag gcg ccg cag gcg ggt 

arg leu gly asn thr pro ser thr pro pro thr thr thr lys lys ala pro gln ala glv 
1621/541 1651/551 *" 

ctg acc aac gag att cag cac cag cag gtt acg acg acc teg cca aaa gag gtc aca gtg 

leu thr asn glu ile gln his gln gln val thr thr thr ser pro lys glu val thr val 
1681/561 * 1711/571 - ■ * 

cag gtc tct aac teg acc ggc cag gec ggt ttg gec acc acc gee acc gat cag etc aag 

gln val ser asn ser thr gly gln ala gly leu ala thr thr ala thr asp gln leu Ivs 
1741/581 1771/591 

egg aac ggc ttc aac gtg atg get ccg gac gac tac ccg agt teg ctg ctg gec acc aca 

arg asn gly phe asn val met ala pro asp asp tyr pro ser ser leu leu ala thr thr 
1801/601 1831/611 

gtg ttt ttt teg ccc ggc aac gaa cag get gec gec acc gtg gec gec gtg ttc ggc cag 

val phe phe ser pro gly asn glu gln ala ala ala thr val ala ala val phe gly gln 

1861/621 1891/631 * 

tea aag ate gag egg gtg acc ggg ate ggc caa ctg gtc cag gtg gtg ctg ggc caa gac 

ser lys He glu arg val thr gly ile gly gln leu val gln val val leu gly gln asp 

SEQ ID N° 32D (suite 1) 



FEUILLE DE ^IP£A»lfeiW^LE 26) 



WO 99/09186 



PCT/FR98/01813 



100/185 



1921/641 

ttc age gcg gtg cgc 
phe ser ala val arg 
1981/661 

aac tec tec age cca 
asn ser ser ser pro 
2041/681 

ace ace tgc gag tag 
thr thr cys glu AMB 



get ccc ctg ccg agt 
ala pro leu pro ser 

ccg ace aag ctg ccc 
pro thr lys leu pro 



1951/651 

ggc tec ace gtc age 
gly ser thr val ser 
2011/671 

gag gac ctg acg gtc 
glu asp leu thr val 



gtg cag ata age cgc 
val gin ile ser arg 

ace aac gee gee gac 
thr asn ala ala asp 



SEQ ID N° 32D (suite 2) 
FIGURE 32D (suite 2) 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant RvG822c 

1/1 31/11 

tag gac atg agt gac ggc gag age gee gcg ccg tgg gca egg etc tec ga 
AMB asp met ser asp gly glu ser ala ala pro trp ala arg leu ser gl 

.61/21 91/31 

ccc gat ggt gtt gac cga tgg ate acg gta ccg ccc gee aca tgg gtg gc 

pro asp gly val asp arg trp ile thr val pro pro ala thr trp val al 

121/41 X51/51 

ccg egg gac ace cag aat gtc ggc tgt cat gee ace ggc gee gtt agt gt 

pro arg asp thr gin asn val gly cys his ala thr gly ala val ser va 

181/61 211/71 

ate gee agg etc ggc ccc get ttt cct gac etc ccc acg cac cgc cat gt 
lie ala arg leu gly pro ala phe pro asp leu pro thr his arg his va 

241/81 271/91 

ccc gag cca tec ggc cgc ggc ccg aag gtc cac gac gac gec gac gac ca 

pro glu pro ser gly arg gly pro lys val his asp asp ala asp asp al 

301/101 331/111 ^ 

gag get ate gee ate ccg gee cac teg etc gag ttc etc teg gag ctt cc 

glu ala ile ala ile pro ala his ser leu glu phe leu ser glu leu pr 

361/121 391/131 

gca gee aac tat ccg cgc gee gac cac gee cgc cgt gaa ccc gag eta cc 

ala ala asn tyr pro arg ala asp his ala arg arg glu pro glu leu pr 

421/141 451/151 

eta acc gga teg get cga gtg egg cca ttg egg ate cgc cga acg teg cc 

leu thr gly ser ala arg val arg pro leu arg ile arg arg thr ser pr 

481/161 511/171 

aag cca gcg ccg aac tec ggc egg cgc ccg atg gtg ctg gee gcg cgc tc 

lys pro ala pro asn ser gly arg arg pro met val leu ala ala arg se 

541/181 571/191 

ctg ttt gee get ctg gcg ttg gcg ctg acc ggc ggg gca tgg cag tgg ag 

leu phe ala ala leu ala leu ala leu thr gly gly ala trp gin trp se 

601/201 631/211 

aac age egg ctg aac atg gta age gcg etc gac ccg cat teg ggc gac at 

asn ser arg leu asn met val ser ala leu asp pro his ser gly asp il 

661/221 691/231 

age ggg cag cat ggc gac gag aac ttc ttg etc gtc ggt atg gac tct eg 

ser gly gin his gly asp glu asn phe leu leu val gly met asp ser ar 

721/241 751/251 

aac gee aat ate ggc gee ggc gac gee gag gac gee ggc ggc gca cgt tc 

asn ala asn He gly ala gly asp ala glu asp ala gly gly ala arg se 

781/261 811/271 

atg ctg gtc aac att ccg gee age cgc gag egg gtc gtc gcg gtg teg tt 

met leu val asn ile pro ala ser arg glu arg val val ala val ser ph 

SEQ ID N° 32F 



FEUILLE DE REMg}£g^E^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



101/185 

841/281 871/291 

ctg gcg ate act cca ate caa tgc gag gcg tgg aac ccc gag ace ggt aag tac gga ccc 

901/301 S/3U PC ° ^ 9 y P " 

ate tac gac gag aag acg gga acg atg ggt ccc aga ctg gtg tac acg gag acc aag ctg 

961/321 " P 9 yS 9 Y ^ fft/331 tyr 9l " thr ly * 

aac teg gca ttc tec ttc ggc ggg cct aag tgt eta gtg aag gtc att caa aaa eta t™ 

5l/5l ^ 3 " 9lY 9ly Pr ° SuSl ^ ^ 

ggc ttg age ate aac egg ttc ate gcg att gac ttc gtc ggt ttc gcg egg atg gtc aaa 

?o" y i} e 6i 9ei: a9n ar9 phe ile ala ile sysv 1 9 y phe ala a * g ~* va * 

gee etc ggc ggc gtc gag gta tgc age acc acc ccg ttg egg gac tac gaa ctg ggc acg 

Su/Si y 9 va 6X5 ser thr u7 X P 3 91 leu arg a3p tyr glu le " siy S 

gtg ctg gag cac gee gga cgc cag gtc att gac ggg ccg acc gcg ctg aac tat gtg cgc 

5oi/Ki a 9 y arg 9ln val ile Si/in 1 * 0 thr ala 1 asn tyr " g 

get cgc cag gtc acc acc gag age aat ggc gac tac ggg cgc ate aaa cgc cag cag ttg 

SSiJili 9 val thr glu 3er asn gly asp tyr gl * arg ile i* 3 «« gin gin ill 

1291/431 

ttt ttg teg teg ctg ctg cgt teg atg ate teg acg gac acc ttg ttc aac etc age aga 

P «i/^i Set leU leU ar9 Ser m6t ile ser thr as P thr l e » P he a3 « leu ser ar? 
1321/441 1351/451 W 

etc aac aac gtc gtc aac atg ttc ate ggt aac age tac gtg gac aac gtc aag acc aaa 

i e «, a3 « a3n " n met Phe " e 9ly asn 3er tvr vai as P val lys thr lya 

1381/461 1411/471 * 

gac ctg gtc gaa etc ggt cga teg ttg cag cat atg gcg gee ggg cac ate aca ttc eta 

a : P !/: B1 Val 9lU UU 9lY ar9 1CU gln ^ " la ala B hi3 va l thr £ va? 
1441/481 1471/491 

acc gtt ccg acc ggt ata acc gac cag aac ggc gac gag ccc ccg cgt acc tec gac atg 

5oi/S01 y aSP ^ a9n is^/ 3 ?^ 111 PC ° Pr ° atg the Ser "P 

aag gcg ctt ttc acc gee ate ate gac gac gatt ccg ctg ccc ctg gaa aac gat cac aac 

n y3 i« a , 1CU ^ th£ 313 Ue ile MP aSP a3p Pr ° leu P" le " 51" "p his asn 
1561/521 1591/531 

gee cag cgt ctg ggc aac acg ccg teg acc ccg ccg acc acc acc aag aag gcg ccg cag 

a 621/54i ar9 9 y Mn 36r i«l/Ml thr lyS lyS ala Pr ° 52 

gcg ggt ctg acc aac gag att cag cac cag cag gtt acg acg acc teg cca aaa gag gtc 

fa!,^ 1 *" ^ Mn glU Ue 9ln gln gln val tnr thc thr aer pro lys all val 
1681/561 1711/571 

aca gtg cag gtc tct aac teg acc ggc cag gec ggt ttg gee acc acc gee acc gat cag 

^«i, 9 Val Ser asn 3er thr gly gln gl * Xeu * l * thr thr ala thr asp gln 
1741/581 1771/591 * 

etc aag egg aac ggc ttc aac gtg atg get ccg gac gac tac ccg agt teg ctg ctg gec 
1801/60i ar9 3311 9 y ^ a3D Wl i83l/6?i a3P tyr Pr ° 3 " 1C " le " ala 

thr III ^ tcg ccc ggc aac gaa cag gct gcc gcc acc gtg g cc g cc gtg ttc 

P ^ 3er pr ° gly asn glu gln aXa aia aXa thr val ala ala val ph- 
1861/621 1891/631 " 

ggc cag tea aag ate gag egg gtg acc ggg ate ggc caa ctg gtc cag gtg gtg ctg ggc 

?921/641 Ser 9lU arg Val gly igla/^! 910 l6U Val gl " Val ^ le " *y 

T C T 390 9 ? g 9t ? Cg ° g ? C CCC Ctg CCg agt ggc tcc acc g fcc a g<= gtg cag ata 
f^/c?^ 3Cr 313 Wl arg ala pr ° leu pro 3er gly 3er thr val ser val gln ile 
1981/661 2011/671 

age cgc aac tcc tcc age cca ccg acc aag ctg ccc gag gac ctg acg gtc acc aac gcc 

2041/68i a3a 36r Pr ° PC ° 173 l6U Pr ° glU a3P l6U thr val thr a3n aia 

gcc gac acc acc tgc gag tag 
ala asp thr thr cys glu amb 



SEQ ID 32F (suite 1) 



FEUILLE BWfiUA^ 26) 



WO 99/09186 



PCI7FR98/01813 



102/185 



1/1 31/11 

CGT CAC CTC TGC CAT GGT CCA TCT ACG GTA TCT GCG ACA AGG GCA GCG TCG ATC CCT CGA 

arg his leu cys his gly pro ser thr val ser ala thr arg ala ala ser ile pro arg 

61/21 91/31 * * 

CAT GCA GAG TCG GTG TTC GCT TCA CGC GAA CTA GGC GCG CCT AGC CTG GAC GAG TCC CCG 
his^ala glu ser val phe ala ser arg glu leu^gly ala pro ser leu asp glu ser pro 

GGC CGA CAT TCG CCC GAG GCC TTG GCC TCC ATC ACC TAA TTG TGT GCA AAA CCG TAT CTA 

?J?y^ g Pr ° 9lU leU ala Ser Ue thr 001 leu cvs ly- tyr leu 

181/61 211/71 

ATT GAT ACG ATT GCG CAC ATG GCT ATC TGG GAT C 

ile asp thr ile ala his met ala ile trp asp 



SEQ ID N° 33A 
FIGURE 33A 



1/1 

GTC ACC TCT GCC ATG GTC CAT 
val thr ser ala met val his 
61/21 

ATG CAG AGT CGG TGT TCG CTT 
met gin ser arg cys ser leu 
121/41 

GCC GAC ATT CGC CCG AGG CCT 
ala asp ile arg pro arg pro 
181/61 

TTG ATA CGA TTG CGC ACA TGG 
leu ile arg leu arg thr trp 









31/11 




CTA CGG 


TAT 


CTG CGA 


CAA 


leu 


arg 


tyr 


leu arg 


gin 








91/31 


CAC 


GCG 


AAC 


TAG GCG 


CGC 


his 


ala 


asn 


AMB ala 


arg 








151/51 


TGG 


CCT 


CCA 


TCA CCT 


AAT 


trp pro 


pro 


ser pro 


asn 








211/71 




CTA 


TCT 


GGG 


ATC 




leu 


ser 


gly 


ile 





SEQ ID N° 33B 
FIGURE 33B 



GGG CAG CGT CGA TCC CTC GAC 
gly gin arg arg ser leu asp 

CTA GCC TGG ACG AGT CCC CGG 
leu ala trp thr ser pro arg 

TGT GTG CAA AAC CGT ATC TAA 
cys val gin asn arg ile OCH 



1/1 

CCG TCA CCT CTG CCA TGG TCC 
pro ser pro leu pro trp ser 
61/21 

ACA TGC AGA GTC GGT GTT CGC 
thr cys arg val gly val arg 
121/41 

GGG CCG ACA TTC GCC CGA GGC 
gly pro thr phe ala arg gly 
181/61 

AAT TGA TAC GAT TGC GCA CAT 
asn OPA tyr asp cys ala his 









31/11 




ATC 


TAC 


GGT 


ATC TGC 


GAC 


ile 


tyr 


gly 


ile cys 


asp 








91/31 




TTC 


ACG 


CGA 


ACT AGG 


CGC 


phe 


thr 


arg 


thr arg 


arg 








151/51 




CTT 


GGC 


CTC 


CAT CAC 


CTA 


leu 


gly 


leu 


his his 


leu 








211/71 




GGC 


TAT 


CTG 


GGA TC 




gly tyr 


leu 


giy 





AAG GGC AGC GTC GAT CCC TCG 
lys gly ser val asp pro ser 

GCC TAG CCT GGA CGA GTC CCC 
ala AMB pro gly arg val pro 

ATT GTG TGC AAA ACC GTA TCT 
ile val cys lys thr val ser 



SEQ ID N° 33C 
FEUILLE DE REMrScEMEN? (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



103/185 



sequence Rvl044 


predite 


par 


Cole et 


al. 


1/1 


















ttg tgt 
leu cys 
61/21 


gca 
ala 


aaa 
lys 


ccg 
pro 


tat 
tyr 


eta 
leu 


att 
ile 


gat acg 
asp thr 


gtc gag 
val glu 
121/ 41 


gtt 
val 


gcc 
ala 


gcc 
ala 


gag 
glu 


caa 
gin 


cat 
his 


ggc tac 
gly tyr 


gtc gac 
val asp 
181/61 


cct 
pro 


gtg 
val 


cag 
gin 


etc 
leu 


cgc 
arg 


etc 
leu 


eta 
leu 


gcg 
ala 


ggt gtg 
gly val 
241/81 


tac 
tyr 


egg 
arg 


gtg 
val 


ccc 
pro 


gtg 
val 


ctg 
leu 


ccg 
pro 


cgt 
arg 


teg tgg 
ser trp 
301/101 


act 
thr 


ttg 
leu 


ggg 

gly 


cgt 
arg 


ggc gtt 
gly val 


ate 
ile 


teg 
ser 


get gac 
ala asp 
361/121 


gtg 
val 


aac 
asn 


ccg 
pro 


teg 
ser 


cgc 
arg 


ate 
ile 


cat 
his 


etc 
leu 


gcc ggg 
ala gly 
421/141 


ggc 
gly 


gag 
glu 


ctg 
leu 


tac 
tyr 


cga 
arg 


gtt 
val 


cac 
his 


cgc 
arg 


gtc gac 
val asp 
481/161 


gga 
gly 


ata 
ile 


ccc 
pro 


gtc 
val 


acg 
thr 


acg 
thr 


gtt gcg 
val ala 


acg gat 
thr asp 
541/181 


cct 
pro 


tat 
tyr 


cag 
gin 


ctt 
leu 


egg 
arg 


gcc 
ala 


gcg 
ala 


ate 
ile 


cgt ggg 
arg gly 
601/201 


tea 
ser 


gca 
ala 


get 
ala 


gag 
glu 


eta 
leu 


cgc 
arg 


get gcg 
ala ala 


egg ccg 
arg pro 


aag 
lys 


cga 
arg 


gca 
ala 


teg 
ser 


gcg 
ala 


tga 
OPA 







(Nature 393:537-544) et contenant seq33A 



31/11 
att gcg 
ile ala 
91/31 
gtc acg 
val thr 
151/51 
ggg cgc 
gly arg 
211/71 
ggt gag 
gly glu 
271/91 
cat gag 
his glu 
331/111 
ace gtc 
thr val 
391/131 
cgc gac 
arg asp 
451/151 
cgc ace 
arg thr 
511/171 
gag cga 
glu arg 
571/191 
etc gat 
leu aso 



cac 
his 


atg 
met 


get 
ala 


ate 
ile 


tgg 
trp 


gat 
asp 


cgc 
arg 


etc 
leu 


act 
thr 


cgc 
arg 


gat 
asp 


gcg 
ala 


cga 
arg 


gac 
asp 


ate 
ile 


ggc 
gly 


gga 
gly 


cgt 
arg 


ctt 
leu 


gag 
glu 


cgt 
arg 


gtc 
val 


ggc 
gly 


cga 
arg 


cac 
his 


gac 
asp 


gat 
asp 


etc 
leu 


gca 
ala 


gcc 
ala 


gca 
ala 


gtg 
val 


teg 
ser 


gcc 
ala 


ttg 
leu 


gcg 
ala 


ctt 
leu 


cat 
his 


gcc 
ala 


etc 
leu 


ccg 
pro 


cgc 
arg 


aac 
asn 


aac 
asn 


cat 
his 


ccg 
pro 


cgt 
arg 


gcg 
ala 


etc 
leu 


cag 
gin 


gca 
ala 


gcc 
ala 


cac 
his 


gtc 
val 


act 
thr 


teg 
ser 


ate 
ile 


aaa 
lys 


gac 
asp 


tgc 
cys 


gtg 
val 


aag 
lys 


acg 
thr 


ggc 
gly 


gcc 
ala 


gaa 
glu 


gcc 
ala 


gag 
glu 


ggc 
gly 


acg 
thr 


ctt 
leu 


cgt 
arg 


gag 
glu 


acc 
thr 


act 
thr 


gcc 
ala 


gga 
gly 


tta 
leu 


cgc 
arg 


get 
ala 



SEQ ID N° 33D 
FIGURE 33D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



104/185 

ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rvl044 
1/1 31/11 

taa ttg tgt gca aaa ccg tat eta att gat acg att gcg cac atg get ate tgg gat cqc 
OCT leu cys ala lys pro tyr leu ile asp thr ile ala his met ala ile trp asp arg 
61/21 91/31 

etc gtc gag gtt gee gee gag caa cat ggc tac gtc acg act cgc gat gcg cga gac ate 
leu yal glu val ala ala glu gin his gly tyr val thr thr arg asp all arg Lp ile 
121/41 151/51 

ggc gtc gac cct gtg cag etc cgc etc eta gcg ggg cgc gga cgt ctt gag cgt gtc ggc 

3SP Pr ° 9 n 1CU l6U l6U 313 9ly arg 9ly arg leu glu arg val g? y 
181/61 211/71 y * 

cga ggt gtg tac egg gtg ccc gtg ctg ccg cgt ggt gag cac gac gat etc gca gec gca 

arg gly val tyr arg val pro val leu pro arg gly glu his asp asp leu ala ala ala 
241/81 271/91 

gtg teg tgg act ttg ggg cgt ggc gtt ate teg cat gag teg gee ttg gcg ctt cat gee 

S/fSf ^ 9ly " g 9ly Val ±le 5er his glu ser ala leu »1» 1^ his ala 

301/101 331/111 

etc get gac gtg aac ccg teg cgc ate cat etc ace gtc ccg cgc aac aac cat ccg cgt 

leu ala asp val asn pro ser arg ile his leu thr val pro arg asn asn his pro arg 

361/121 391/131 

gcg gec ggg ggc gag ctg tac cga gtt cac cgc cgc gac etc cag gca gee cac gtc act 

S?/ii 3 9 y 9 y 9lU l6U tyr arg Val arg arg as P leu gln ala his val thr 
421/141 451/151 

teg gtc gac gga ata ccc gtc acg acg gtt gcg cgc acc ate aaa gac tgc gtg aag acg 

!»f ,75 8SP 9ly 116 Pr ° Val thr thr Val ala arg thc ile lvs as P «?« val lys thr 
481/161 511/171 

ggc acg gat cct tat cag ctt egg gec gcg ate gag cga gec gaa gec gag ggc acg ctt 

SlwXf 3SP Pr ° tyr 9 1SU arg ala ala ile glu arg ala « lu ala «lu gly thr leu 
541/181 . 571/191 

cgt cgt ggg tea gca get gag eta cgc get gcg etc gat gag acc act gee gga tta cqc 

601/201 " 9 ^ aSP glU thr thr dla g ^ y leu «* 

get egg ccg aag cga gca teg gcg tga 
ala arg pro lys arg ala ser ala OPA 

SEQ ID N° 33F 
FIGURE 33F 



1/1 

ATC CAA CCT GCT GGG CCT GCG 
ile gin pro ala gly pro ala 
61/21 

ACA ACA CCT GGA ATG GGG ACC 
thr thr pro gly met gly thr 
121/41 

CCT CGG TCG AGA CGT ATC GCG 
pro arg ser arg arg ile ala 
181/61 

CGC CGC ATA TTT GCC GCG CTG 
arg arg ile phe ala ala leu 









31/11 




CCT 


TCG 


AAT 


CGA CGG 


CCA 


pro 


ser 


asn 


arg arg 


pro 








91/31 




TTT 


TCG 


GTG 


TTG CTG 


GTA 


phe 


ser 


val 


leu leu 


val 








151/51 




GCA 


GCG 


TTG 


GCC CTG 


TCG 


ala 


ala 


leu 


ala leu 


ser 








211/71 




CCG 


CGG 


GCC 


GGA TC 




pro 


arg 


ala 


gly 





GGC CAC CGC TCG CTG CCG GCA 
gly his arg ser leu pro ala 

ACC GGG ACA ACC GGC ACC ACG 
thr gly thr thr gly thr thr 

TTG CTG ACA ATT ACC GCT GGC 
leu leu thr ile thr ala gly 



SEQ ID N° 34A 



FEUILLE DE RENlRSJSl^f (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



105/185 



1/1 31/11 

TCC AAC CTG CTG GGC CTG CGC CTT CGA ATC GAC GGC CAG GCC ACC GCT CGC TGC CGG CAA 

ser asn leu leu gly leu arg leu arg ile asp gly gin ala thr ala arg cys arg qln 
61/21 91/31 

CAA CAC CTG GAA TGG GGA CCT TTT CGG TGT TGC TGG TAA CCG GGA CAA CCG GCA CCA CGC 

gin his leu glu trp gly pro phe arg cys cys trp OCH pro gly gin pro ala pro arg 
121/41 151/51 

CTC GGT CGA GAC GTA TCG CGG CAG CGT TGG CCC TGT CGT TGC TGA CAA TTA CCG CTG GCC 

leu gly arg asp val ser arg gin arg trp pro cys arg cys OPA gin leu pro leu ala 
181/61 211/71 

GCC GCA TAT TTG CCG CGC TGC CGC GGG CCG GAT C 

ala ala tyr leu pro arg cys arg gly pro asp 



SEQ ID N° 34B 
FIGURE 34B 



1/1 31/11 

GAT CCA ACC TGC TGG GCC TGC GCC TTC GAA TCG ACG GCC AGG CCA CCG CTC GCT GCC GGC 
asp pro thr cys trp ala cys ala phe glu ser thr ala arg pro pro leu ala ala qlv 
61/21 91/31 

AAC AAC ACC TGG AAT GGG GAC CTT TTC GGT GTT GCT GGT AAC CGG GAC AAC CGG CAC CAC 
asn asn thr trp asn gly asp leu phe gly val ala gly asn arg asp asn arg his his 
121/41 • 151/51 

GCC TCG GTC GAG ACG TAT CGC GGC AGC GTT GGC CCT GTC GTT GCT GAC AAT TAC CGC TGG 
ala ser val glu thr tyr arg gly ser val gly pro val val ala asp asn tyr arg trp 
181/61 211/71 
CCG CCG CAT ATT TGC CGC GCT GCC GCG GGC CGG ATC 
pro pro his ile cys arg ala ala ala gly arg ile 



SEQ ID N° 34C 
FIGURE 34C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



106/185 

ORF d'apres Cole et al. (Nature 393:537-544) contennant seq34A 
1/1 

tag ccg cag ggc cct c 

AMB pro gin gly pro a 
61/21 

ttg cag cag tta caa c 

leu gin gin leu gin a 
121/41 

agg gga gac gtt gcg c 

arg gly asp val ala q 
181/61 

cca ggc cac cgc teg c 

pro gly his arg ser 1 
241/81 

gta acc ggg aca acc g 

val thr gly thr thr q 
301/101 

teg ttg ctg aca att a 

ser leu leu thr ile t 
361/121 

agg teg acc tgc cag a 

arg ser thr cys gin i 
421/141 

gcg acg gca ggc cca c 

ala thr ala gly pro 1 
481/161 

etc acg ctt ggc ttc atg ccg cag 

leu thr leu gly phe met pro gin 

SEQ ID N° 34F 
FIGURE 34 F 











31/11 








get 


agg 


cgc 


acre 


caa tac 


cgt 


i-yy 


egg 


ala 


arg 


arg 


alv 


arg cys 


arg 




arg 










91/31 






caa 


atg gag 


tct 


nan rrir* 


ate 


ytc gag 


tec 


gin met glu 


ser 


glu arg 




vra 1 rt 1 \ t 


phe 










151/51 




cga 


egg 


ate 


caa 


cct get 




cct gcg 


cct 


arg 


arg 


ile 


oln 


pro ala 




ptu aid 


pro 










211/71 






ccg 


gca 


aca 


aca 


cct aaa 


atg 


aact arr 
y y y tn-i^ 


ttt 


pro 


ala 


thr 


thr 






yiy i.nr 


phe 










271/91 






acc 


acg 


cct 




teg aga 


cgt 


ate gcg 


gca 


thr 


thr 


pro 


arg 


ser arg 


arg 


xj.e axa 


aia 










331/111 






get 


ggc 


cgc 


cgc 


ata ttt 


acc 


oca eta 


ccg 


ala gly arg 


arg 


ile phe 


ala 


ala leu 


pro 










391/131 






tea 


ccg 


cgc 


age 


ate tac 


gec 


gtt cgc 


tgc 


ser 


pro 


arg 


ser 


ile tyr 


ala 


val arg 


cys 










451/151 






tct 


tgg 


cat 


gcg 


tec aat 


get 


gcg acg 


tec 


ser 


trp his 


ala 


ser asn 


ala 


ala thr 


ser 










511/171 








ccg 


cag 


tec 


tac 


cca tgt 


agt 


aac aga 


tag 


pro gin 


ser 


tyr 


pro cys 


ser 


asn arg 


AMB 



egg 
arg 


caa 
gin 


teg 
ser 


atg 
met 


gat 
asp 


cag 
gin 


etc 
leu 


ggc 
gly 


teg 
ser 


aat 
asn 


cga 
arg 


egg 
arg 


teg 
ser 


gtg 
val 


ttg 
leu 


ctg 
leu 


gcg 
ala 


ttg 
leu 


gee 
ala 


ctg 
leu 


egg 
arg 


gee 
ala 


gga 
gly 


tec 
ser 


aaa 
lys 


ccg 
pro 


ccg 
pro 


act 
thr 


teg 
ser 


gta 
val 


gac 
asp 


aag 
lys 



1/1 

CAG TCT GTC GGC AAG GAG GGA CGC ATG CCA 
gin ser val gly lys glu gly arg met pro 
61/21 

CAG ATC GAG AGC GCT CTC TAC GCC GAA GAT 
gin ile glu ser ala leu tyr ala glu asp 
121/41 

GGC TTC CGC GCA CCG ACC GCG CGG CGG CGC 
gly phe arg ala pro thr ala arg arg arg 
181/61 

CTG GGG ATG TTG GTT TCC GGC^ GTG GCG TTC 
leu gly met leu val ser gly val ala phe 
241/81 

CTC AGC GTT TTC GGT TTT GTC GTG ATG TTC 
leu ser val phe gly phe val val met phe 
301/101 

CGG TTG TCC GGC AGG ATG GAT CGT GGC GGA 
arg leu ser gly arg met asp arg gly gly 
361/121 

ACC AAG GGG GCC GGG GGC TCA TTC ACC AGC 
thr lys gly ala gly gly ser phe thr ser 



SEQ 



31/11 
















CTC TCC 


GAT 


CAT GAG 


CAG 


CGG 


ATG 


CTT 


GAC 


leu ser 


asp 


his glu 


gin 


arg 


met 


leu 


asp 


91/31 














CCC AAG 


TTC 


GCA TCG 


AGT 


GTC 


CGT 


GGC 


GGG 


pro lys 


phe 


ala ser 


ser 


val 


arg 


gly 


gly 


151/51 










CTG CAG 


GGC 


GCG GCG 


TTG 


TTC 


ATC 


ATC 


GGT 


leu gin 


gly 


ala ala 


leu 


phe 


ile 


ile 


gly 


211/71 














AAA GAG 


ACC 


ATG ATC 


GGA 


AGT 


TTC 


CCG 


ATA 


lys glu 


thr 


met ile 


gly 


ser 


phe 


pro 


ile 


271/91 










GGT GGT 


GTG 


GTG TAT 


GCC 


ATC 


ACC 


GGT 


CCT 


gly gly 


val 


val tyr 


ala 


ile 


thr 


gly 


pro 


331/111 












TCG GCT 


GCT 


GGG GCT 


TCG 


CGC 


CAG 


CGT 


CGT 


ser ala 


ala 


gly ala 


ser 


arg 


gin 


arg 


arg 


391/131 












CGT ATG 


GAA 


GAT C 












arg met 


glu 


asp 













N° 35A 



FEUILLE DE REIU^^EME^J (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



107/185 



1/1 31/11 
GAC AGT CTG TCG GCA AGG AGG GAC GCA TGC CAC TCT 
asp ser leu ser ala arg arg asp ala cys his ser 
61/21 91/ 31 
ACC AGA TCG AGA GCG CTC TCT ACG CCG AAG ATC CCA 
thr arg ser arg ala leu ser thr pro lys ile pro 
121/41 , 151/51 

GGG GCT TCC GCG CAC CGA CCG CGC GGC GGC GCC TGC 
gly ala ser ala his arg pro arg gly gly ala cys 
181/61 211/71 
GTC TGG GGA TGT TGG TTT CCG GCG TGG CGT TCA AAG 
val trp gly cys trp phe pro ala trp arg ser lys 
241/81 271/91 
TAC TCA GCG TTT TCG GTT TTG TCG TGA TGT TCG GTG 
tyr ser ala phe ser val leu ser OPA cys ser val 
301/101 331/111 
CTC GGT TGT CCG GCA GGA TGG ATC GTG GCG GAT CGG 
leu gly cys pro ala gly trp ile val ala asp arq 
361/121 391/131 



ATG AGC AGC 
met ser ser 


GGA TGC 
gly cys 


TTG 
leu 


CAT CGA 
his a rrr 


GTG 

vaJ. 


TCC 
ser 


GTG 
va± 


GCG 
ala 


CGG CGT 
arg arg 


TGT 
cys 


TCA 
ser 


TCA 
ser 


TCG 
ser 


TGA TCG 
OPA ser 


GAA 
glu 


GTT 
val 


TCC 
ser 


CGA 
arg 


TGT ATG 
cys met 


CCA 
pro 


TCA 
ser 


CCG 
pro 


GTC 
val 


GGG CTT 
gly leu 


CGC 
arg 


GCC 
ala 


AGC 
ser 


GTC 
val 


ATC 
ile 











SEQ ID N° 35B 
FIGURE 35B 



1/1 

ACA GTC TGT CGG CAA 
thr val cys arg gin 
61/21 

CCA GAT CGA GAG CGC 
pro asp arg glu arg 
121/41 

GGG CTT CCG CGC ACC 
gly leu pro arg thr 
181/61 

TCT GGG GAT GTT GGT 
ser gly asp val gly 
241/81 

ACT CAG CGT TTT CGG 
thr gin arg phe arg 
301/101 

TCG GTT GTC CGG CAG 
ser val val arg gin 
361/121 

TAC CAA GGG GGC CGG 
tyr gin gly giy arg 



GGA GGG ACG CAT GCC 
gly gly thr his ala 

TCT CTA CGC CGA AGA 
ser leu arg arg arg 

GAC CGC GCG GCG GCG 
asp arg ala ala ala 

TTC CGG CGT GGC GTT 
phe arg arg gly val 

TTT TGT CGT GAT GTT 
phe cys arg asp val 

GAT GGA TCG TGG CGG 
asp gly ser trp arg 

GGG CTC ATT CAC CAG 
gly leu ile his gin 



31/11 








ACT CTC 


CGA 


TCA 


TGA 


thr leu 


arg 


ser 


OPA 


91/31 








TCC CAA 


GTT 


CGC 


ATC 


ser gin 


val 


arg 


ile 


151/51 








CCT GCA 


GGG 


CGC 


GGC 


pro ala 


gly arg 


gly 


211/71 






CAA AGA 


GAC 


CAT 


GAT 


gin arg 


asp 


his 


asp 


271/91 






CGG TGG 


TGT 


GGT 


GTA 


arg trp 


cys 


gly 


val 


331/111 








ATC GGC 


TGC 


TGG 


GGC 


ile gly 


cys 


trp 


gly 


391/131 








CCG TAT 


GGA 


AGA 


TC 


pro tyr 


gly 


arg 





GCA 
ala 


GCG 
ala 


GAT GCT 
asp ala 


TGA 
OPA 


GAG 
glu 


TGT 
cys 


CCG TGG 
pro trp 


CGG 
arg 


GTT 
val 


GTT 
val 


CAT CAT 
his his 


CGG 
arg 


CGG AAG 
arg lys 


TTT CCC 
phe pro 


GAT 
asp 


TGC 
cys 


CAT 
his 


CAC CGG 
his arg 


TCC 
ser 


TTC 
phe 


GCG 
ala 


CCA GCG 
pro ala 


TCG 
ser 



SEQ ID N e 35C 



FEUILLE DE REM£t55£lftflE^ff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



108/185 



sequence Rv2169c predite par Cole et al. (Nature 393:537-544) et contenant 
partiellement seq35A 1 concenant 

1/1 31/11 

ST ctt gac 
t leu asp 

91/31 
t ggc ggg 
3 gly gly 

151/51 
z ate ggt 
3 ile gly 

211/71 
= ccg ata 
2 pro ile 

271/91 
z ggt cct 
c gly pro 
331/111 
j cgt cgt 
\ arg arg 
391/131 



atg cca 
Met pro 
61/21 


etc 
leu 


tec 
ser 


gat 
asD 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


gaa gat 
glu asp 
121/41 


ccc 
pro 


aag 
lys 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 

vax 


egg cgc 
arg arg 
181/61 


ctg 
leu 


cag 
gin 


ggc 
gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


gcg ttc 
ala phe 
241/81 


aaa 

lys 


gag 
glu 


acc 
thr 


atg 
met 


ate 
ile 


gga 

gly 


agt 
ser 


atg ttc 
met phe 
301/101 


ggt 
gly 


ggt 
gly 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


ggc gga 
gly gly 
361/121 


teg 
ser 


get 
ala 


get 
ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


acc age 
thr ser 


cgt 
arg 


atg 
met 


gaa 
glu 


gat 
asp 


egg 
arg 


ttc 
phe 


egg 
arg 



cag 
gin 


ate 
ile 


gag 
glu 


age 
ser 


get 
ala 


etc 
leu 


tac 
tyr 


gee 
ala 


ggc 
gly 


ttc 
phe 


coc 
arg 


oca 
ala 


ccg 
pro 


thr 


gcg 
ala 


egg 
arg 


ctg 
leu 


ggg 

gly 


atg 
met 


ttg 
leu 


gtt 
val 


tec 
ser 


ggc 

giy 


gtg 
val 


etc 
leu 


age 
ser 


gtt 
val 


ttc 
phe 


ggt 
gly 


ttt 
phe 


gtc 
val 


gtg 
val 


egg 
arg 


ttg 
leu 


tec 
ser 


ggc 
gly 


agg 
arg 


atg 
met 


gat 
asp 


cgt 
arg 


acc 
thr 


aag 
lys 


ggg 

gly 


gee 
ala 


ggg 

gly 


ggc 
gly 


tea 
ser 


ttc 
phe 



SEQ ID N° 35D 
FIGURE 35D 



ORF d'apres 


Cole et 


al. 


(Nature 


393:537 


1/1 


















tga cag 
OPA gin 
61/21 


tct 
ser 


gtc 
val 


ggc 
gly 


aag 
lys 


gag 
glu 


gga 

giy 


cgc 
arg 


atg 
met 


gac cag 
asp gin 
121/41 


ate 
ile 


gag 
glu 


age 
ser 


get 
ala 


etc 
leu 


tac 
tyr 


gee 
ala 


gaa 
glu 


ggg ggc 

gly gly 
181/61 


ttc 
phe 


cgc 
arg 


gca 
ala 


ccg 
pro 


acc 
thr 


gcg 
ala 


egg 
arg 


egg 
arg 


ggt ctg 
gly leu 
241/81 


ggg 

gly 


atg 
met 


ttg 
leu 


gtt 
val 


tec 
ser 


ggc 

giy 


gtg 
val 


gcg 
ala 


ata etc 
ile leu 
301/101 


age 
ser 


gtt 
val 


ttc 
phe 


ggt 
gly 


ttt 
phe 


gtc 
val 


gtg 
val 


atg 
met 


cct egg 
pro arg 
361/121 


ttg 
leu 


tec 
ser 


ggc 

giy 


agg 
arg 


atg 
met 


gat 
asp 


cgt 
arg 


ggc 

giy 


cgt acc 
arg thr 
421/141 


aag 
lys 


ggg 
giy 


gec 
ala 


ggg 

gly 


ggc 

giy 


tea 
ser 


ttc 
phe 


acc 
thr 


ttc gac 
phe asp 


gag 
glu 


taa 
OCH 















544) et contennant Rv2169c 



31/11 


















cca etc 
pro leu 
91/31 


tec 
ser 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


atg 
met 


ctt 
leu 


gat ccc 
asp pro 
151/51 


aag 
lys 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


cgt 
arg 


ggc 

giy 


cgc ctg 
arg leu 
211/71 


cag 
gin 


ggc 
gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


ate 
ile 


ate 
ile 


ttc aaa 
phe lys 
271/91 


gag 
glu 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


ttc 
phe 


ccg 
pro 


ttc ggt 
phe gly 
331/111 


ggt 

giy 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


acc 
thr 


ggt 

giy 


gga teg 
gly ser 
391/131 


get 
ala 


get 
ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag 
gin 


cgt 
arg 


age cgt 
ser arg 


atg 
met 


gaa 
glu 


gat 
asp 


egg 
arg 


ttc 
phe 


egg 
arg 


cgc 
arg 


cgc 
arg 



SEQ ID 35F 



FEUILLE DE REWyP-^I^E^REGLE 26) 



WO 99/09186 



PCT/FR98/0I813 



109/185 



1/1 31/11 
GAC CTG GGA CGA AGA CGA CGG CAG CAG CCG CAA TCA 
asp leu gly arg arg arg arg gin gin pro gin ser 
61/21 91/31 
CAA TGG ACA CCC GAC TAC GGT GCG CCT GCG CGG CTC 
gin trp thr pro asp tyr gly ala pro ala arg leu 
121/41 151/51 
GTG GTC GGA GTG CCA CCC GAC CAG GCC ACC GAC TTC 
val val gly val pro pro asp gin ala thr asp phe 
181/61 211/71 
ACG GCG CCG GTC TGG ATC ACC ATG CTG TGG CCG CTG 
thr ala pro val trp ile thr met leu trp pro leu 
241/81 271/91 
GGG GCA CCC GGT GGC ACC GTT CCC GTC CGG CTG GTC 
gly ala pro gly gly thr val pro val arg leu val 
301/101 331/111 
GCC AAC GGC GGC CGG CTG GAC ATC CTC CTG TCG GCG 
ala asn gly gly arg leu asp ile leu leu ser ala 
361/121 391/131 



CCT 
pro 


GGT 
gly 


CAA CGT 
gin arg 


TTC 
phe 


CTG 
leu 


TTG CCC 
leu pro 


GCA 
ala 


CCA 
pro 


GAA ACG 
glu thr 


CGG 
arg 


TTG 
leu 


GCC CCC 
ala pro 


GCA 
ala 


AAC 
asn 


TCG CTG 
ser leu 


ACC 
thr 


AAC 
asn 


CGG GAA 
arg glu 


CCA 
pro 


GAT 
asp 


C 



SEQ ID N° 36A 
FIGURE 36A 



1/1 

ACC TGG GAC GAA 
thr trp asp glu 
61/21 

AAT GGA CAC CCG 
asn gly his pro 
121/41 

TGG TCG GAG TGC 
trp ser glu cys 
181/61 

CGG CGC CGG TCT 
arg arg arg ser 
241/81 

GGG CAC CCG GTG 
gly his pro val 
301/101 

CCA ACG GCG GCC 
pro thr ala ala 
361/121 

TCG ACC CCG ACG 
ser thr pro thr 



GAC GAC GGC AGC 
asp asp gly ser 

ACT ACG GTG CGC 
thr thr val arg 

CAC CCG ACC AGG 
his pro thr arg 

GGA TCA CCA TGC 
gly ser pro cys 

GCA CCG TTC CCG 
ala pro phe pro 

GGC TGG ACA TCC 
gly trp thr ser 

GCG CCG TCG GCC 
ala pro ser ala 







31/11 


AGC 


CGC 


AAT CAG 


ser 


arg 


asn gin 






91/31 


CTG 


CGC 


GGC TCG 


leu 


arg 


gly ser 






151/51 


CCA 


CCG 


ACT TCG 


pro 


pro 


thr ser 






211/71 


TGT 


GGC 


CGC TGG 


cys 


gly 


arg trp 






271/91 


TCC 


GGC 


TGG TCG 


ser 


gly 


trp ser 






331/111 


TCC 


TGT 


CGG CGG 


ser 


cys 


arg arg 






391/131 


GAG 


CGC 


TGT GCC 


glu 


arg 


cys ala 



ATC TAC CCG GTC 
ile tyr pro val 

ACA ATG CGC GGT 
thr met arg gly 

GCT CCG CTG TTG 
ala pro leu leu 

CCG ACC GGC CCC 
pro thr gly pro 

ACG ACG ACC TGG 
thr thr thr trp 

CCG AGT TCG CCA 
pro ser ser pro 

TGG CCA TCG ACC 
trp pro ser thr 



CTG GTC AAC GTC 
leu val asn val 

TCC TGT TGC CCG 
ser cys cys pro 

CAC CAG AAA CGA 
his gin lys arg 

GGT TGG CCC CCG 
gly trp pro pro 

CAA ACT CGC TGG 
gin thr arg trp 

CCA ACC GGG AAG 
pro thr gly lys 

CAG ATC 
gin ile 



SEQ ID N° 36B 



FEUILLE DE REMKSMl^P{REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



110/185 



1/1 31/11 
CCT GGG ACG AAG / 
pro gly thr lys t 
61/21 

ATG GAC ACC CGA C 
met asp thr arg 1 
121/41 

GGT CGG AGT GCC P 
gly arg ser ala t 
181/61 

GGC GCC GGT CTG G 
gly ala gly leu a 
241/81 

GGC ACC CGG TGG C 
gly thr arg trp h 
301/101 

CAA CGG CGG CCG G 
gin arg arg pro a 
361/121 



ACG 


GCA 


GCA 


GCC 


GCA 


ATC AGA 


TCT 


ACC 


CGG 


TCC 


1 WW 


1LA AC b 


TCA 


thr 


ala 


ala 


ala 


ala 


ile arg 


ser 


thr 


arg 


ser 


trp 


ser thr 


ser 












91/31 












CGG 


TGC 


GCC 


TGC 


GCG 


GCT CGA 


CAA 


TGC 


GCG 


GTT 


CCT 


GTT GCC 


CGT 


arg 


cys 


ala 


cys 


ala 


ala arg gin 


CVS 

j 


ala 


val 


pro 


val ala 


arg 












151/51 












CGA 


CCA 


GGC 


CAC 


CGA 


CTT CGG 


CTC 


cgc 


TGT 


TGC 


ACC 


AGA AAC 


GAC 


arg pro gly his arg 


leu arg 


leu 


arg 


cys 


cys 


thr 


arg asn 


asp 












211/71 












CAC 


CAT 


GCT 


GTG 


GCC 


GCT GGC 


CGA 


CCG 


GCC 


CCG 


GTT 


GGC CCC 


CGG 


his 


his 


ala 


val 


ala 


ala gly 


arg 


pro 


ala 


pro 


val 


gly pro 


arg 












271/91 












CGT 


TCC 


CGT 


CCG 


GCT 


GGT CGA 


CGA 


CGA 


CCT 


GGC 


AAA 


CTC GCT 


GGC 


arg 


ser 


arg 


pro 


ala 


gly arg 


arg 


arg 


pro gly lys 


leu ala 


gly 












331/111 














GGA 


CAT 


CCT 


CCT 


GTC 


GGC GGC 


CGA 


GTT 


CGC 


CAC 


CAA 


CCG GGA 


AGT 


gly his pro pro val 


gly gly 


arg 


val 


arg 


his 


gin 


pro gly 


ser 












391/131 










CGT 


CGG 


CCG AGC 


GCT 


GTG CCT 


GGC 


CAT 


CGA 


CCC 


AGA 


TC 




arg 


arg 


pro 


ser 


ala 


val pro gly his 


arg 


pro 


arg 







SEQ ID N° 36 C 
FIGURE 36C 



Sequence codante Rv3909 predite par Cole et al 1998 (Nature 393 537-544) 
contehant Seq 36A 

I' 1 31/11 



GTG ACC 


GCA 


CTG 


CAA 


CTC 


GGC 


TGG 


GCC 


GCT 


TTG GCG 


CGC 


GTC 


ACC 


TCA 


GCG 


met thr 


ala 


leu 


gin 


leu 


gly 


trp 


ala 


ala 


leu ala 


arg 


val 


thr 


ser 


ala 


61/21 


















91/31 








GTG GCC 


GGC 


CTC 


GGG 


ATG 


GCG 


CTC 


ACG 


GTA 


CCG TCG 


GCG 


GCA 


CCG 


CAC 


GCG 


val ala 


gly 


leu 


gly 


met 


ala 


leu 


thr 


val 


pro ser 


ala 


ala 


pro 


his 


ala 


121/41 


















151/51 








GAG CCC 


AGC 


CCG 


ACG 


CCT 


TTT 


GTC 


CAG 


GTC 


CGC ATC 


GAT 


CAG 


GTG 


ACC 


CCG 


glu pro 


ser 


pro 


thr 


pro 


phe 


val 


gin 


val 


arg ile 


asp 


gin 


val 


thr 


pro 


181/61 


















211/71 






ACC ACT 


TCC 


AGC 


GAA 


CCC 


CAT 


GTC 


ACC 


GTC 


AGC GGA 


ACG 


GTG 


ACC 


AAT 


ACC 


thr thr 


ser 


ser 


glu 


pro 


his 


val 


thr 


val 


ser gly 


thr 


val 


thr 


asn 


thr 


241/81 


















271/91 








CCA GTC 


CGC 


GAT 


GTG 


ATG 


GTC 


CGG 


CTT 


GAG 


CAC GCC 


GCC 


GCG 


GTC 


ACG 


TCG 


pro val 


arg 


asp 


val 


met 


val 


arg 


leu 


glu 


his ala 


ala 


ala 


val 


thr 


ser 


301/101 


















331/111 








TTA CGC 


ACC 


TCG 


CTC 


GAC 


GGC 


GGC 


ACC 


GAC 


CAG TAC 


CAG 


CCG 


GCC 


GCG 


GAC 


leu arg 


thr 


ser 


leu 


asp 


gly 


gly 


thr 


asp 


gin tyr gin 


pro 


ala 


ala 


asp 



SEQ ID N° 36D 



FIGURE 36D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



111/185 



361/121 
















GTC GCC 


CCC 


GAA 


CTA 


GAC CGC 


GGG 


CAA GAG 


val ala 


pro 


glu 


leu 


asp arg 


gly gin glu 


421/141 
















TCG CTG 


ACC 


AGG 


CCG 


TCG TTG 


GCC 


GTC 


AAC 


ser leu 


thr 


arg 


pro 


ser leu 


ala 


val 


asn 


481/161 
















GTC AAT 


GGG 


ACA 


CCC 


GAC TAC 


GGT 


GCG 


CCT 


val asn 


gly 


thr 


pro 


asp tyr 


gly ala 


pro 


541/181 














CCC GTG 


GTC 


GGA 


GTG 


CCA CCC 


GAC 


CAG 


GCC 


pro val 


val 


gly 


val 


pro pro 


asp gin ala 


601/201 
















ACG ACG 


GCG 


CCG 


GTC 


TGG ATC 


ACC 


ATG 


CTG 


thr thr 


ala 


pro 


val trp ile 


thr met 


leu 


661/221 
















CCC GGG 


GCA 


CCC 


GGT 


GGC ACC 


GTT 


CCC 


GTC 


pro gly 


ala 


pro 


gly gly thr 


val 


pro 


val 


721/241 














CTG GCC 


AAC 


GGC 


GGC 


CGG CTG 


GAC 


ATC 


CTC 


leu ala 


asn 


gly 


gly 


arg leu 


asp 


ile 


leu 


781/261 














GAA GTC 


GAC 


CCC 


GAC 


GGC GCC 


GTC 


GGC 


CGA 


glu val 


asp 


pro 


asp gly ala 


val gly arg 


841/281 
















CTC ATC 


ACC 


GTC 


AAT 


GCG ATG 


ACC 


GGC 


GGC 


leu ile 


thr 


val 


asn 


ala met 


thr gly gly 


901/301 
















GCT CAA 


CTA 


CCG 


GGC 


ACC CCG 


ACC 


CAC 


CCG 


ala gin 


leu 


pro 


gly thr pro 


thr 


his 


pro 


961/321 














CTG GAT 


CGA 


TTG 


CGG ACG CTA 


GTC CAC 


CGG 


leu asp 


arg 


leu 


arg 


thr leu 


val 


his 


arg 


1021/341 












GCC GAC 


CTG 


GAT 


GCT TTG CAG 


CGG 


GTT 


AAT 


ala asp 


leu 


asp 


ala 


leu gin 


arg 


val 


asn 


1081/361 










AGC CCC 


GCC 


GAC 


ATC 


GTC GAC 


CGC ATC 


CTG 


ser pro 


ala 


asp 


ile 


val asp 


arg 


ile 


leu 


1141/381 










CTG CCC 


GAC 


GGC 


CCG 


TTG ACC 


GGC 


CGG 


GCG 


leu pro 


asp 


gly 


pro 


leu thr 


gly 


arg 


ala 


1201/401 










GTT GCC 


GTC 


GCG 


GCC 


GCC GAT 


TTT 


AGC 


CCC 


val ala 


val 


ala 


ala 


ala asp 


phe 


ser 


pro 


1261/421 








TCC GCG 


CTC 


TTA 


CCC 


GCT ACC 


GCG 


CCC 


CGG 


ser ala 


leu 


leu 


pro 


ala thr 


ala 


pro 


arg 


1321/441 










TTT GAT 


CCC 


GCG 


GTC 


GGG GCC 


GCG 


CTG 


GCC 


phe asp 


pro 


ala 


val 


gly ala 


ala 


leu 


ala 


1381/461 












TAT CTA 


GAT 


CCC 


TCG 


TTG TTC 


GTT 


CGG 


ATC 


tyr leu 


asp 


pro 


ser 


leu phe 


val 


arg 


ile 



SEQ ID N° 



391/131 



GCC GGC 


TTT 


ACC 


CTC 


TCG 


GCC 




CTG 


CGC 


ala gly phe 


thr 


leu 


ser 


ala 


pro 


leu 


arg 


451/151 














CAG CCC 


GGG 


ATC 


TAC 


CCG 


GTC 


CTG 


GTC AAC 


gin pro gly 


ile 


tyr pro val 


1 <*n 


val 


asn 


511/171 
















GCG CGG 


CTC 


GAC 


AAT 


GCG 


CGG 


1 1C 


CTG 


TTG 


ala arg 


leu 


asp 


asn 


ala 


arg 


pne 


leu 


leu 


571/191 














ACC GAC 


TTC 


GGC 


TCC 


GCT 


GTT 




CCA 


GAA 


thr asp phe 


gly ser ala val 


al a 

did 


pro 


glu 


631/211 














TGG CCG 


CTG 






CGG 


CCC 


CGG 


TTG 


GCC 


trp pro 


leu 


a±a 


asp 


arg 


pro 


arg 


leu 


ala 


691/231 












CGG CTG 


GTC 


GAC 


GAC 


GAC 


CTG 


GCA 


AAC 


TCG 


arg leu 


val 


asp 


asp 


asp 


leu 


aia 


asn 


ser 


751/251 
















CTG TCG 


GCG 


GCC 


GAG 


TTC 


GCC 


ACC 


AAC 


CGG 


leu ser 


ala 


ala 


glu 


phe 


ala 


rnr 


asn 


arg 


811/271 
















GCG CTG 


TGC 


CTG 


GCC 


ATC 


GAC 


CCA 


GAT 


CTA 


ala leu 


cys 


leu 


ala 


ile 


asp 


pro 


asp 


leu 


871/291 














TAC GTC 


GTG 


TCC 


GAC 


TCG 


CCC 


fur* 
GAC 


GGG 


GCC 


tyr val 


val 


ser 


asp 


ser 


pro 


a en 


gly ala 


931/311 
















GGC ACC 


GGC 


CAG 


GCC 


GCC 


GCA 


TCC 


AGC 


TGG 


gly thr gly 


gin 


ala 


ala 


ala 


ser 


ser 


trp 


991/331 
















ACA TGC 


GTG 


ACG 


CCG 


CTG 


CCT 


TTT 


GCC 


CAA 


thr cys 


val 


thr 


pro 


leu 


pro 


phe 


ala 


gin 


1051/351 










GAT CCG 


AGG 


CTG 


AGC 


GCG 


ATC 


ecu. 


ACC 


ATC 


asp pro 


arg 


leu 


ser 


ala 


ile 


ala 


thr 


ile 


1111/371 














GAT GTC AGC 


TCC ACC 


CGC 


GGC 


win 


ACC 


GTG 


asp val 


ser 


ser 


thr 


arg gly 




thr 


val 


1171/391 














ATC AAC 


TTG 


CTC 


AGC 


ACC 


CAC 


out 


AAC 


ACG 


ile asn 


leu 


leu 


ser 


thr 


his 


orl v 


asn 


thr 


1231/411 














GAG GAA 


CAG 


CAG 


GGT 


TCG 


TCC 


CAG 


ATC 


GGC 


glu glu 


gin 


gin 


gly 


ser 


ser 


gin 


ile 


gly 


1291/431 












CGG TTG 


TCC 


CCG 


CGG 


GTG 


GTA 


GCG 


GCG 


CCG 


arg leu 


ser 


pro 


arg 


val 


val 


ala 


ala 


pro 


1351/451 














GCC GCG 


GGA 


ACA AAC 


CCG 


ACC 


GTT 


CCT 


ACC 


ala ala 


gly 


thr 


asn 


pro 


thr 


val 


pro 


thr 


1411/471 












GCG CAT 


GAA 


TCG 


ATC 


ACC 


GCG 


CGC 


CGC 


CAG 


ala his 


glu 


ser 


ile 


thr 


ala 


arg 


arg gin 



(suite 1) 



FEUILLE E^£eRPLA@EM6NT|L(REdtE 26) 



WO 99/09186 



PCT/FR98/01813 



112/185 



1441/481 1471/491 

GAC GCC TTG GGC GCA ATG CTG TGG CGC AGC TTG GAG CCG AAT GCC GCG CCC CGT ACC CAA 

woi/iSi 9lY trP " 9 l6U glu Pr ° asn ala ala P" "9 thr gin 

1501/501 1531/511 

ATC CTG GTG CCG CCG GCG TCG TGG AGC CTG GCC AGC GAC GAC GCG CAG GTC ATC CTG ACC 

SSiSt PE ° Pr ° trP leU ala S " asp asp ala gln val ile 1™ thr 

1561/521 1591/531 

GCG CTG GCC ACC GCC ATC CGG TCT GGC CTG GCC GTG CCG CGA CCA CTA CCG GCG GTG ATC 

a 6 a i/ e V la aE9 gly leU ala Val pro arg P» leu pro ala 3 

1621/541 1651/551 

GCT GAC GCC GCG GCC CGC ACC GAG CCA CCG GAA CCC CCG GGC GCT TAC AGC GCC GCT CGC 

'mwSi 313 ^ tHr 9lU Pr ° PC ° glu pro pro glv ala tyr ser ala ala arg 

1681/561 1711/571 

GGC CGG TTC AAT GAC GAC ATC ACC ACG CAG ATC GGC GGG CAG GTT GCC CGG CTA TGG AAG 

?^i/s«i P 3SP Ue thr thr gln ile gly gly gln val ala arg leu trp lys 

1741/581 1771/591 

CTG ACC TCG GCG TTG ACC ATC GAT GAC CGC ACC GGG CTG ACC GGC GTG CAG TAC ACC GCA 

jB01/601 Ser r " e aSP 3SP aCg 9ly l6U thr glV Val ^ fc yr thr ala 

1B01/601 1831/611 

CCA CTA CGC GAG GAC ATG TTG CGC GCG CTG AGC CAA TCG CTA CCA CCC GAT ACC CGC AAC 

llll/Tll^ 9 9 aSP arg l6U S6r gln S " l6U Pr ° P« as P ^r arg atn 

1861/621 1891/631 

GGG CTG GCC CAG CAG CGG CTG GCC GTC GTT GGA AAG ACG ATC GAC GAT CTT TTC GGC GCG 
1921/641 Val Val gly lyS thC Ue aSP aSp leu P he & ala 

GTG ACC ATC GTC AAC CCG GGC GGC TCC TAC ACT CTG GCC ACC GAG CAC AGT CCG CTG CCG 

3Sn Pr ° 9ly gly S6r tyr thr leu ala ^r glu his ser pro leu pro 
1981/661 . 2011/671 

TTG GCG CTG CAT AAT GGC CTC GCC GTG CCA ATC CGG GTC CGG CTA CAG GTC GAT GCT CCG 

Jmi/Jhi ^ 9ly l6U 313 Val Pr ° ile arg Val arg leu * ln val asp ala pro 

2041/681 2071/691 

CCC GGG ATG ACG GTG GCC GAT GTC GGT CAG ATC GAG CTA CCG CCC GGG TAC CTG CCG CTA 

^ni/7ni met Val aSP Val 9ly 9ln ile 9lu leu P™ P EO 9ly tyr leu pro leu 
2101/701 2131/711 

CGA GTA CCA ATC GAG GTG AAC TTC ACA CAG CGG GTT GCC GTC GAC GTG TCG CTG CGG ACC 

a ^iT*ii Pr ° glU Val aSn Phe thC 9ln arg Val ala val as P val se * leu arg thr 
2161/721 2191/731 

CCC GAC GGC GTC GCG CTG GGT GAA CCG GTG CGG TTG TCG GTG CAC TCC AAC GCC TAC GGC 

Smwtm* 7 Val 9ly glU Pr ° Val arg l6U SeC Val his ser asn tyr gly 

2221/741 2251/751 

AAG GTG TTG TTC GCG ATC ACG CTA TCC GCT GCG GCC GTG CTG GTA ACG CTG GCG GGC CGG 

wili/Si ^ l6U SBt 313 313 ala Val leu val thr leu ala gly arg 

2281/761 2311/771 

CGC CTT TGG CAC CGG TTC CGT GGC CAG CCT GAT CGC GCC GAC CTG GAT CGC CCC GAC CTG 

a ^?W7ni trP ar9 Phe aEg 9ly gl " PC0 asp arg ala as P leu as P ar 9 P« aso leu 
2341/781 2371/791 

CCT ACC GGC AAA CAC GCC CCG CAG CGC CGT GCC GTA GCC AGT CGG GAT GAC GAA AAG CAC 

^ul/5oi 9ly h " Pr ° arg Val 313 S6r 319 aS P aS P glu lvs h " 

CGG GTA TGA 
arg val OPA 



SEQ ID N° 36D (suite 2) 
FIGURE 36D (suite 2) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

113/185 



ORF d'apres Cole et al., 1998 (Nature 393 537-544) et contenant Rv 3909. 
1/1 31/11 



91/31 

i GCG ATC 
ala ile 
151/51 

: GCG CTC 
ala leu 
211/71 
CCG GAC 
pro asp 
271/91 
ACC GGT 
thr gly 
331/111 
TCG TCA 
ser ser 
391/131 
GAC TTC 
asp phe 
451/151 
GCC CCG 
ala pro 
511/171 
GTC CTG 
val leu 
571/191 
CGG TTC 
arg phe 
631/211 
GTT GCA 
val ala 
691/231 
CCC CGG 
pro arg 
751/251 
CTG GCA 
leu ala 
811/271 
GCC ACC 
ala thr 
871/291 
GAC CCA 
asp pro 
931/311 
CCC GAC 
pro asp 
991/331 



TGA CTC 


AGC 


ACC 


OPA leu 


ser 


thr 


61/21 






GGC TGG 


GCC 


GCT 


gly trp 


ala 


ala 


121/41 






GCG CTC 


ACG 


GTA 


ala leu 


thr 


val 


181/61 






TTT GTC 


CAG 


GTC 


phe val 


aln 


val 


241/81 






CAT GTC 


ACC 


GTC 


his val 


thr 


val 


301/101 






GTC CGG 


CTT 


GAG 


val arg 


leu 


alu 


361/121 






GGC GGC 


ACC 


GAC 


alv alv 


thr 


asp 


421/141 






CGC GGG 


CAA 


GAG 


ara alv 


aln. 


glu 


481/161 






TTG GCC 


GTC 


AAC 


leu ala 


val 


asn 


541/181 






TAC GGT 


GCG 


CCT 


tyr gly 


ala 


nro 


601/201 






CCC GAC 


CAG 


GCC 


pro asp 


gin 


ala 


661/221 






ATC ACC 


ATG 


CTG 


ile thr 


met 


leu 


721/241 






ACC GTT 


CCC 


GTC 


thr val 


pro 


val 


781/261 






CTG GAC 


ATC 


CTC 


leu asp 


ile 


leu 


841/281 






GCC GTC 


GGC 


CGA 


ala val 


gly 


arg 


901/301 






ATG ACC 


GGC 


GGC 


met thr 


gly 


gly 


961/321 






CCG ACC 


CAC 


CCG 


pro thr 


his 


pro 



SEQ ID N° 36F 
FEUILLE DE REMFUWBEMETCFtREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



114/185 



1021/341 

CTA GTC CAC CGG ACA TGC GTG ACG CCG CTG 
leu val his arg thr cys val thr pro leu 
1081/361 

CAG CGG GTT AAT GAT CCG AGG CTG AGC GCG 
gin arg val asn asp pro arg leu ser ala 
1141/381 

GAC CGC ATC CTG GAT GTC AGC TCC ACC CGC 
asp arg ile leu asp val ser ser thr arg 
1201/401 

ACC GGC CGG GCG ATC AAC TTG CTC AGC ACC 
thr gly arg ala ile asn leu leu ser thr 
1261/421 

GAT TTT AGC CCC GAG GAA CAG CAG GGT TCG 
asp phe ser pro glu glu gin gin gly ser 
1321/441 

ACC GCG CCC CGG CGG TTG TCC CCG CGG GTG 
thr ala pro arg arg leu ser pro arg val 
1381/461 

GCC GCG CTG GCC GCC GCG GGA ACA AAC CCG 
ala ala leu ala ala ala gly thr asn pro 
1441/481 

TTC GTT CGG ATC GCG CAT GAA TCG ATC ACC 
phe val arg ile ala his glu ser ile thr 
1501/501 

CTG TGG CGC AGC TTG GAG CCG AAT GCC GCG 
leu trp arg ser leu glu pro asn ala ala 
1561/521 

TCG TGG AGC CTG GCC AGC GAC GAC GCG CAG 
ser trp ser leu ala ser asp asp ala gin 
1621/541 

CGG TCT GGC CTG GCC GTG CCG CGA CCA CTA 
arg ser gly leu ala val pro arg pro leu 
1681/561 

ACC GAG CCA CCG GAA CCC CCG GGC GCT TAC 
thr glu pro pro glu pro pro gly ala tyr 
1741/581 

ATC ACC ACG CAG ATC GGC GGG CAG GTT GCC 
ile thr thr gin ile gly gly gin val ala 
1801/601 

ATC GAT GAC CGC ACC GGG CTG ACC GGC GTG 
ile asp asp arg thr gly leu thr gly val 
1861/621 

TTG CGC GCG CTG AGC CAA TCG CTA CCA CCC 
leu arg ala leu ser gin ser leu pro Dro 
1921/641 

CTG GCC GTC GTT GGA AAG ACG ATC GAC GAT 
leu ala val val gly lys thr ile asp aso 
1981/661 

GGC GGC TCC TAC ACT CTG GCC ACC GAG CAC 
gly gly ser tyr thr leu ala thr glu his 



1051/351 
















CCT TTT GCC CAA 
pro phe ala gin 
1111/371 


GCC 
ala 


GAC 
asp 


CTG 
leu 


GAT 
asp 


GCT 
ala 


TTG 
leu 


ATC GCA ACC 
ile ala thr 
1171/391 


ATC 
ile 


AGC 
ser 


CCC 
pro 


GCC 
ala 


GAC 
asp 


ATC 
ile 


GTC 
val 


GGC GCA ACC 
gly ala thr 
1231/411 


GTG 
val 


CTG 
leu 


CCC 
pro 


GAC 
asp 


GGC 
gly 


CCG 
pro 


TTG 
leu 


CAC GGC AAC ACG GTT GCC 
his gly asn thr val ala 
1291/431 


GTC 
val 


GCG 
ala 


GCC 
ala 


GCC 
ala 


TCC CAG ATC 
ser gin ile 
1351/451 


GGC 
gly 


TCC 
ser 


GCG 
ala 


CTC 
leu 


TTA 
leu 


CCC 
pro 


GCT 
ala 


GTA GCG GCG 
val ala ala 
1411/471 


CCG TTT 
pro phe 


GAT 
asp 


CCC 
pro 


GCG 
ala 


GTC 
val 


GGG 
gly 


ACC GTT CCT 
thr val pro 
1471/491 


ACC 
thr 


TAT CTA 
tyr leu 


GAT 
asp 


CCC 
pro 


TCG 
ser 


TTG 
leu 


GCG CGC CGC CAG 
ala arg arg gin 
1531/511 


GAC 
asp 


GCC 
ala 


TTG 
leu 


GGC 
gly 


GCA ATG 
ala met 


CCC CGT ACC 
pro arg thr 
1591/531 


CAA 
gin 


ATC 
ile 


CTG 
leu 


GTG 
val 


CCG 
pro 


CCG 
pro 


GCG 
ala 


GTC ATC CTG 
val ile leu 
1651/551 


ACC 
thr 


GCG 
ala 


CTG 
leu 


GCC 
ala 


ACC 
thr 


GCC 
ala 


ATC 
ile 


CCG GCG GTG 
pro ala val 
1711/571 


ATC 
ile 


GCT 
ala 


GAC 
asp 


GCC 
ala 


GCG 
ala 


GCC 
ala 


CGC 
arg 


AGC GCC GCT 
ser ala ala 
1771/591 


CGC GGC CGG 
arg gly arg 


TTC 
phe 


AAT 
asn 


GAC 
asp 


GAC 
asp 


CGG CTA TGG 
arg leu trp 
1831/611 


AAG 
lys 


CTG ACC 
leu thr 


TCG 
ser 


GCG 
ala 


TTG 
leu 


ACC 
thr 


CAG TAC ACC 
gin tyr thr 
1891/631 


GCA 
ala 


CCA 
pro 


CTA 
leu 


CGC 
arg 


GAG 
glu 


GAC 
asp 


ATG 
met 


GAT ACC CGC 
asp thr arg 
1951/651 


AAC 
asn 


GGG CTG 
gly leu 


GCC 
ala 


CAG 
gin 


CAG 
gin 


CGG 
arg 


CTT TTC GGC GCG 
leu phe gly ala 
2011/671 


GTG 
val 


ACC 
thr 


ATC 
ile 


GTC 
val 


AAC 
asn 


CCG 
pro 


AGT CCG CTG 
ser pro leu 


CCG 
pro 


TTG 
leu 


GCG 
ala 


CTG 
leu 


CAT 
his 


PJKT 
asn 


GGC 
gly 



SEQ ID 36F (suite 1) 
FIGURE 36F (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



115/185 



2041/681 2071/691 

CTC GCC GTG CCA ATC CGG GTC CGG CTA CAG GTC GAT GCT CCG CCC GGG ATG ACG GTG GCC 

iTointi Pr ° ±le " g val ar9 leu 9ln 2 a 3i/ni ala Pr ° Pr ° 9ly met thr val ala 

GAT GTC GGT CAG ATC GAG CTA CCG CCC GGG TAC CT^CCG CTA CGA GTA CCA ATC GAG GTG 

EXiEii* Y 9 9 Pr ° Pr ° 9ly tyr lGU Pr ° leu ar * val P« ile S val 

2161/721 2191/731 

AAC TTC ACA CAG CGG GTT GCC GTC GAC GTG TCG CTG CGG ACC CCC GAG GGC GTC GCG CTG 

22^41 9 ar9 ^ Wl Sm/Ei"* aSP *™ 

GGT GAA CCG GTG CGG TTG TCG GTG CAC TCC AAC GCC TAC GGC AAG GTG TTG TTC GCG ATC 

mm/Xi*™ Val 1CU Val h±S 3er asn ala tyr gly lys val P he U« 
2281/761 2311/771 

ACG CTA TCC GCT GCG GCC GTG CTG GTA ACG CTG GCG GGC CGG CGC CTT TGG CAC CGG TTC 

Till/I*!**' Val ^ leU ala gly arg le « <*P h " «g phe 

2341/781 2371/791 

CGT GGC CAG CCT GAT CGC GCC GAC CTG GAT CGC CCC GAC CTG CCT ACC GGC AAA CAC GCC 

2401/B01 aSP arg aSP aSP 2«i%n aSP Pr ° ^ gly lyS his ala 

CCG CAG CGC CGT GCC GTA GCC AGT CGG GAT GAC GAA AAG CAC CGG GTA TGA 
pro gin arg arg ala val ala ser arg asp asp glu lys his arg val OPA 



SEQ ID 36F (suite 2) 
FIGURE 36F (suite 2) 



1/1 

ATC CGC GCG TTG GCG TCG CAT 
ile arg ala leu ala ser his 
61/21 

CAC AGC GGC GCC CAA ATC ATG 
his ser gly ala gin ile met 
121/41 

CTC AAC CTG CCC TGG CTG GCC 
leu asn leu pro trp leu ala 
181/61 

GCA GCC GGG CAG CTT CGA GAG 

ala ala gly gin leu arg glu 

241/81 

CGC AAG ATC 

arg lys ile 









31/11 




CCG 


AAC 


ATC 


GTC GGA 


GTC 


pro 


asn 


ile 


val gly 


val 








91/31 




GCC 


GAC 


ACC 


GGA CTG 


GCC 


ala 


asp 


thr 


gly leu 


ala 








151/51 




ATG 


GGC 


GCC 


ACG GGC 


TTC 


met 


gly 


ala 


thr gly 


phe 








211/71 




TTG 


TTG 


TCC 


GCC TTC 


GGT 


leu 


leu 


ser 


ala phe 


qlv 



AAG GAC GCC AAA GCC GAC CTG 
lys asp ala lys ala asp leu 

TAC TAT TCC GGC GAC GAC GCG 
tyr tyr ser gly asp asp ala 

ATC AGC GTG ATT GCC CAC CTG 
ile ser val ile ala his leu 

TCT GGG GAT ATC GCC ACC GCC 
ser gly asp ile ala thr ala 



SEQ ID N° 37A 



FIGURE 37A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



116/185 



1/1 31/11 

GAT CCG CGC GTT GGC GTC GCA TCC GAA CAT CGT CGG AGT CAA GGA CGC CAA AGC CGA CCT 
asp pro arg val gly val ala ser glu his arg arg ser gin gly arg gin ser arg pro 
61/21 91/31 

GCA CAG CGG CGC CCA AAT CAT GGC CGA CAC CGG ACT GGC CTA CTA TTC CGG CGA CGA CGC 

S?/?J n Pr ° aSn hiS gly arg hiS arg thr 91/ leu leu phe arg arg arg arg 

121/41 151/51 

GCT CAA CCT GCC CTG GCT GGC CAT GGG CGC CAC GGG CTT CAT CAG CGT GAT TGC CCA CCT 
ala gin pro ala leu ala gly his gly arg his gly leu his gin arg asp cys pro pro 
181/61 211/71 

GGC AGC CGG GCA GCT TCG AGA GTT GTT GTC CGC CTT CGG TTC TGG GGA TAT CGC CAC CGC 

24i/8i r arg ala ala ser arg val val val arg leu arg phe trp gly tyr ar ^ his "9 

CCG CAA GAT C 
pro gin asp 



SEQ ID N° 37B 
FIGURE 37B 



1/1 

TCC GCG CGT TGG CGT CGC ATC 
ser ala arg trp arg arg ile 
61/21 

ACA GCG GCG CCC AAA TCA TGG 
thr ala ala Dro lys ser trp 
121/41 

TCA ACC TGC CCT GGC TGG CCA 
ser thr cys pro gly trp pro 
181/61 

CAG CCG GGC AGC TTC GAG AGT 
gin pro gly ser phe glu ser 
241/81 
GCA AGA TC 
ala arg 







31/11 




CGA ACA TCG 


TCG GAG 


TCA 


arg thr 


ser 


ser glu 


ser 






91/31 




CCG ACA CCG 


GAC TGG 


CCT 


pro thr 


pro 


asp trp 


pro 






151/51 




TGG GCG 


CCA 


CGG GCT 


TCA 


trp ala 


pro 


arg ala 


ser 






211/71 




TGT TGT 


CCG 


CCT TCG 


GTT 


cys cys 


pro 


pro ser 


val 



SEQ ID N° 37C 
FIGURE 37C 



AGG ACG CCA AAG CCG ACC TGC 
arg thr pro lys pro thr cys 

ACT ATT CCG GCG ACG ACG CGC 
thr ile pro ala thr thr arg 

TCA GCG TGA TTG CCC ACC TGG 
ser ala OPA leu pro thr trp 

CTG GGG ATA TCG CCA CCG CCC 
leu gly ile ser pro pro pro 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



117/185 

Sequence codante Rv2753c predite par Cole et al., 1998 (Nature 393 537-544> 
cbntenant Seq 37A 

1/1 31/11 
GTG ACC / 
val thr t 
61/21 
ACA CCG 1 
thr pro f 
121/41 
CTG GTC C 
leu val c 
181/61 
ACC ACC C 
thr thr a 
241/81 
GCC CGT C 
ala arg \ 
301/101 
GCT TGT C 
ala cys a 
361/121 
CCG CAG C 
pro gin a 
421/141 
CTG CTC 1 
leu leu t 
481/161 
TTG GCG 1 
leu ala s 
541/181 
GCC CAA / 
ala gin i 
601/201 
CCC TGG C 
pro trp 1 
661/221 
CAG CTT C 
gin leu a 
721/241 
AAC ATT C 
asn lie a 
781/261 
AAG GCG C 
lys ala c 
841/281 



GTC GGA 


TTC 


GAC 


GTC 


GCA 


GCG 


CGC CTA 


GGA 


ACC 


CTG 


CTG 


ACC 


GCG 


ATG 


GTG 


val gly 


phe 


asp 


val 


ala 


ala 


arg leu gly thr 


leu 


leu 


tnr 


aia 


met 


val 














91/31 
















AGC GGC 


GAT 


GGC 


TCC 


CTG 


GAC ACC GCC 


ACC 


GCG 


GCG 


CGG 


CTG 


GCC 


AAC 


CAC 


ser gly 


asp 


gly 


ser 


leu 


asp 


thr ala 


thr 


ala 


aid 


arg 


1 Oil 

leu 


ala 


asn 


his 














151/51 












CAG GGG 


TGC 


GAC 


GGT 


CTG 


GTG 


GTC TCG 


GGC 


ACC 


ACC 


GGC 


GAG 


TCG 


CCG ACC 


gin gly 


cys 


asp gly 


leu 


val 


val ser 


gly thr 




gly 


glu 


ser 


pro 


thr 














211/71 










GGG GAG 


AAA 


ATC 


GAG 


CTG 


CTG 


CGG GCC 


GTC 


TTG 


GAA 


GCG 


GTG 


GGG 


GAC 


CGG 


gly glu 


lys 


ile glu 


leu 


leu 


arg ala 


Val 


leu 


n 1 1 1 


al a 


vai 


gly 


asp 


arg 














271/91 












ATC GCC 


GGT 


GCC 


GGC 


ACC 


TAT 


GAC ACC 




CAC 


AGC 


ATC 


CGG 


CTG 


GCC 


AAG 


ile ala 


gly 


ala gly 


thr 


tyr asp thr 


ala 


his 




lie 


arg 


1 an 

leu 


ala 


lys 














•501 /111 
JJl/ 111 














GCC GAG 


GGT 


GCG 


CAC 


GGG 


CTG 


CTG GTG 


VJ 1 v~ 


2Vr*f* 


CCC 


TAC 


TAT 


TCC 


AAG 


CCG 


ala glu 


giy 


ala 


his 


gly 


leu 


leu val 


val 


in l 


pro 


rvr 

tyr 


cyr 


ser 


lys 


pro 














391/131 












GGG CTG 


CAA 


GCC 


CAT 


TTC 


ACC 


GCC GTC 




rap 


GCG 


ACC 


GAG 


CTG 


CCG 


ATG 


gly leu 


gin 


ala 


his 


phe 


thr 


ala val 


ala 


asp 


al a 

aid 




glu 


1 All 

leu 


pro 


met 














451/151 














GAC ATC 


CCG 


GGG 


CGG 


TCG 


GCG 


GTG CCG 


rtiv. 




CCC 


GAC 


ACG 


ATC 


CGC 


GCG 


asp ile 


pro 


gly arg 


ser 


ala 


val pro 


ile 


glu 


pro 


asp 


Will 


lie 


arg 


ala 














511/171 














CAT CCG 


AAC 


ATC 


GTC 


GGA 


GTC 


AAG GAC 


GCC 


AAA 


GCC 


GAC 


CTG 


CAC 


AGC 


GGC 


his pro 


asn 


ile 


val 


gly 


val 


lys asp 


ala 


lys 


ala 


asp 


leu 


hi « 

nis 


ser 


gly 














571/191 
















ATG GCC 


GAC 


ACC 


GGA 


CTG 


GCC 


TAC TAT 


TCC 


GGC 


GAC 


GAC 


GCG 


CTC 


AAC 


CTG 


met ala 


asp 


thr gly 


leu 


ala 


tyr tyr 


ser 


gly 


asp 


asp 


ala 


leu 


asn 


leu 














631/211 
















GCC ATG 


GGC 


GCC 


ACG 


GGC 


TTC 


ATC AGC 


GTG 


ATT 


GCC 


CAC 


CTG 


GCA 


GCC 


GGG 


ala met 


gly 


ala 


thr 


gly 


phe 


ile ser 


val 


ile 


ala 


his 


leu 


ala 


ala 


gly 














691/231 
















GAG TTG 


TTG 


TCC 


GCC 


TTC 


GGT 


TCT GGG 


GAT 


ATC 


GCC 


ACC 


GCC 


CGC 


AAG 


ATC 


glu leu 


leu 


ser 


ala 


phe 


gly 


ser gly 


asp 


ile 


ala 


thr 


ala 


arg 


lvs ile 














751/251 
















GTC GCC 


CCG 


CTG 


TGC 


AAC 


GCG 


ATG AGC 


CGC 


CTG 


GGT 


GGG 


GTG 


ACG 


TTG 


TCC 


val ala 


pro 


leu 


cys 


asn 


ala 


met ser 


arg 


leu 


gly 


gly 


val 


thr 


leu 


ser 














811/271 














TTG CGG 


CTG 


CAG 


GGC 


ATC 


GAC 


GTC GGT 


GAT 


CCC 


CGG 


CTG 


CCC 


CAG 


GTG 


GCC 


leu arg 


leu 


gin gly 


ile 


asp 


val gly 


asp 


pro 


arg 


leu 


pro 


gin 


val 


ala 














871/291 














GAG CAG 


ATC 


GAC 


GCG 


TTG 


GCC 


GCC GAC 


ATG 


CGC 


GCG 


GCC 


TCG 


GTG 


CTT 


CGG 


glu gin 


ile 


asp 


ala 


leu 


ala 


ala asp 


met 


arg 


ala 


ala 


ser 


val 


leu 


arg 



901/301 

TGA 

OPA 



SEQ ID N° 37D 
FIGURE 37D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



118/185 



ORF d'apres Cole et al., 1998 (Nature 393 537-544) contenant Rv2753c 

1/1 31/11 
TAA GGT 
OCH gly 
61/21 
CTT CTT 
leu leu 
121/41 
CGA GTT 
arg val 
181/61 
CAA CGC 
gin arg 
241/81 
GAG CGT 
gin arg 
301/101 
CCG GCA 
pro ala 
361/121 
CGT CGT 
arg arg 
421/141 
CGA CGC 
arg arg 
481/161 
CCA ACC 
pro thr 
541/181 
CAA CGC 
gin arg 
601/201 
CGC AAT 
arg asn 
661/221 
GCG CCA 
ala pro 
721/241 
CGA CGG 
arg arg 
781/261 
GGA CAA 
gly gin 
841/281 
ACC GTC 
thr val 
901/301 
TTT AGC 
phe ser 
961/321 



GAG 


CGC 


CGT 


GGC 


CGA 


GAC 


CGC 


GCC 


GCT GCG 


CGT 


GCA 


ACT 


glu 


arg 


arg 


gly 


arg 


asp 


arg 


ala 


ala ala 


ara 


ala 


thr 
















91/31 






GGC 


CCC 


ACC 


CGA 


CGT 


GCC 


CTG 


GAC 


CAC CGA 


CGC 


CGA 


CGG 


gly 


pro 


thr 


arg 


arg 


ala 


leu 


asp 


his arg 


arg 


a rn 


a JL y 


















151/51 




CGC 


CGG 


CCG 


GGC 


CTG 


CTA 


TCA 


GAG 


CTG GTC 


CAA 


GCC 


CAA 


arg 


arg 


pro 


gly 


leu 


leu 


ser 


crlu 


leu val 


gin 


ala 
a x ci 


gin 


















211/71 




CGG 


CTA 


CCT 


CCG 


GCA 


CAT 


CAT 


CGA 


CGT CGG 


ACA 


TTT 


CTC 


arg 


leu 


pro 


pro 


ala 


his 


his 


ara 


arn am 




phe 


leu 


















271/91 






GTC 


GTT 


CTA 


CAT 


CAC 


CGG 


GAT 


CTC 


GCG ATC 


GTG 


CAC 


CCA 


val 


val 


leu 


his 


his 


arg 


asp 


leu 


ala ile 


val 


hi <? 


pro 


















331/111 






TTT 


CTC 


CTA 


CTC 


GCA 


GCT 


CTC 


CCA 


GCG CTA 


CGT 


ACC 


CGA 


phe 


leu 


leu 


leu 


ala 


ala 


leu 


pro 


ala leu 


a rg 


t-h r 


arg 


















391/131 






GCC 


GCC 


CGG 


CAT 


GGA 


GGA 


CGA 


CGC 


CGA CCT 


GCG 


CCA 


CAT 


ala 


ala 


arg 


his 


gly 


gly 


arq 


ara 


ara nro 
451/151 




pro 


his 


CGC 


CCG 


CGC 


CAC 


CTA 


CAG 


CGA 


GCT 


GCT GGC 


CAA 


GCT 


GGA 


arg 


pro 


arg 


his 


leu 


gin 


arg 


ala 


ala alv 


gin 


ala 




















511/171 






CAA 


CGC 


GAT 


CCT 


GCG 


CCG 


CAA 


GCA 


GGC CCG 


CCA 


AGC 


CGC 


gin 


arg 


asp 


pro 


ala 


pro 


gin 


ala 


alv oro 


pro 


aci. 


rrt 
aig 


















571/191 






CAC 


CGA 


AAC 


CCG 


CAT 


CGT 


GGT 


GAC 


CGG CAA 


CTA 


CCG 


GGC 


his 


arg 


asn 


pro 


his 


arg 


gly 


asp 


ara aln 


leu 


pro 


rr 1 \r 

gj-y 


















631/211 






GCG 


GGC 


CAG 


CGA 


GCA 


CGC 


CGA 


CGT 


GGA AAT 


CCG 


GCG 


ACT 


ala 


gly 


gin 


arg 


ala 


arg 


arg 


ara 


gly asn 
691/231 


pro 


ala 


thr 


GCT 


CGC 


CGC 


CGT 


GGC 


CCC 


CGC 


GGT 


GTT CGC 


CGA 


CTT 


CGA 


ala 


arg 


arg 


arg 


gly 


pro 


arg 


gly 


val arg 


ara 


leu 


arg 


















751/251 






CAC 


CGA 


GGT 


GGC 


GAC 


CAG 


CCC 


GTT 


GGC GAC 


CGA 


AGC 


CTG 


his 


arg 


gly 


gly 


asp 


gin 


pro 


val 


gly asp 


arg 


ser 


leu 


















811/271 






ACA 


CGC 


GCG 


CTC 


GCG 


GCC 


GGG 


ATA 


AAG CGC 


CAG 


GTA 


ACC 


thr 


arg 


ala 


leu 


ala 


ala 


gly 


ile 


lys arg 
871/291 


gin 


val 


thr 


GGA 


TTC 


GAC 


GTC 


GCA 


GCG 


CGC 


CTA 


GGA ACC 


CTG 


CTG 


ACC 


gly 


phe 


asp 


val 


ala 


ala 


arg 


leu 


gly thr 
931/311 


leu 


leu 


thr 


GGC 


GAT 


GGC 


TCC 


CTG 


GAC 


ACC 


GCC 


ACC GCG 


GCG 


CGG 


CTG 


gly 


asp 


gly 


ser 


leu 


asp 


thr 


ala 


thr ala 


ala 


arg 


leu 


















991/331 






GGG 


TGC 


GAC 


GGT 


CTG 


GTG 


GTC 


TCG 


GGC ACC 


ACC 


GGC 


GAG 


gly 


cys 


asp 


gly 


leu 


val 


val 


ser 


gly thr 


thr 


gly 


glu 



SEQ ID N° 37F 



FIGURE 37F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



119/185 



1021/341 1051/351 
GAC GGG GAG AAA ATC GAG CTG CTG CGG GCC GTC TTG C 
asp gly glu lys ile glu leu leu arg ala val leu c 
1081/361 1111/371* 
GTT ATC GCC GGT GCC GGC ACC TAT GAC ACC GCG CAC / 
val ile ala gly ala gly thr tyr asp thr ala his s 
1141/381 1171/391 
GCG GCC GAG GGT GCG CAC GGG CTG CTG GTG GTC ACG C 
ala ala glu gly ala his gly leu leu val val thr p 
1201/401 1231/411 
CGG GGG CTG CAA GCC CAT TTC ACC GCC GTC GCC GAC G 
arg gly leu gin ala his phe thr ala val ala asp a 
1261/421 1291/431 
TAT GAC ATC CCG GGG CGG TCG GCG GTG CCG ATC GAG C 
tyr asp ile pro gly arg ser ala val pro ile glu c 
1321/441 1351/451 
TCG CAT CCG AAC ATC GTC GGA GTC AAG GAC GCC AAA G 
ser his pro asn ile val gly val lys asp ala lys a 
1381/461 1411/471 
ATC ATG GCC GAC ACC GGA CTG GCC TAC TAT TCC GGC G 
ile met ala asp thr gly leu ala tyr tyr ser gly a 
1441/481 1471/491 
CTG GCC ATG GGC GCC ACG GGC TTC ATC AGC GTG ATT G 
leu ala met gly ala thr gly phe ile ser val ile a 
1501/501 1531/511 
CGA GAG TTG TTG TCC GCC TTC GGT TCT GGG GAT ATC G 
arg glu leu leu ser ala phe gly ser gly asp ile a 
1561/521 . 1591/531 

GCG GTC GCC CCG CTG TGC AAC GCG ATG AGC CGC CTG G 
ala val ala pro leu cys asn ala met ser arg leu q 
1621/541 1651/551 
GGC TTG CGG CTG CAG GGC ATC GAC GTC GGT GAT CCC C 
gly leu arg leu gin gly ile asp val gly asp pro a 
1681/561 1711/571 



GTG 
val 


GGG GAC 
gly asp 


CGG 
arg 


GCC 
ala 


CGT 
arg 


CGG 
arg 


CTG 
leu 


GCC 
ala 


AAG 
lys 


GCT 
ala 


TGT 
cys 


TAT 
tyr 


TCC AAG 
ser lys 


CCG 
pro 


CCG CAG 
pro gin 


GAG CTG 
glu leu 


CCG 
pro 


ATG 
met 


CTG 
leu 


CTC 
leu 


ACG 
thr 


ATC 
ile 


CGC 
arg 


GCG 
ala 


TTG 
leu 


GCG 
ala 


CTG 
leu 


CAC 
his 


AGC 
ser 


GGC 
gly 


GCC 
ala 


CAA 
gin 


GCG 
ala 


CTC 
leu 


AAC 
asn 


CTG 
leu 


CCC 
pro 


TGG 
trp 


CTG 
leu 


GCA GCC 
ala ala 


GGG 
gly 


CAG CTT 
gin leu 


GCC 
ala 


CGC AAG 
arg lys 


ATC 
ile 


AAC 
asn 


ATT 
ile 


GTG 
val 


ACG 
thr 


TTG 
leu 


TCC 
ser 


AAG 
lys 


GCG 
ala 


CCC CAG GTG 
pro gin val 


GCC 
ala 


GCG 
ala 


ACA 
thr 


TCG 
ser 


GTG 
val 


CTT 
leu 


CGG 
arg 


TGA 
OPA 





SEQ ID N° 37F (suite 1) 
FIGURE 37F (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



120/185 

1/1 

GCG GTG AAC TGG TGG GCC CGG ATG GTT < 
ala val asn trp trp ala arg met val 
61/21 

AGA CGA CGG ATG GAA GGA GAT GCT GGC * 
arg arg arg met glu gly asp ala gly , 
121/41 

TCG TCG TCT ACG GAG GTG AAG GCG GCG I 
ser ser ser thr glu val lys ala ala . 
181/61 

ACT GGC CCG CAG GTG AAG GCG GCG GAT ' 
thr gly pro gin val lys ala ala asp : 
241/81 

GAC GCG TGC CCA GAA CAG GCC CTC GTC < 
asp ala cys pro glu gin ala leu val < 
301/101 

CTT GTT GGC ATT GCG GCG ACG CTG CTC ( 
leu val gly ile ala ala thr leu leu « 
361/121 

TTT GCG TTG CGC TCA CAC CAG GAA AGC < 
phe ala leu arg ser His gin glu ser < 
421/141 



481/161 

AGC ATG CAG AAG ATC 
ser met gin lys ile 



31/11 














GTA CGC 


CGT 


CGC 


AAA CTC 


GAG CAC 


AAC 


AGG 


val arg 


arg 


arg 


lys leu 


glu his 


asn 


arg 


91/31 












GGC CAG 


CTG 


AAC 


CCT GCC 


GAT GCG 


AAT 


AAG 


gly oln 


leu 


asn 


pro ala 


asp ala 


asn 


lys 


151/51 










TCG GCG 


GAA 


TCT 


GAC GCC 


GGA GCC 


GAC 


CAG 


ser ala 


crlu 


ser 




gly ala 


asp 


gin 


211/71 










GCG GAA 


TCT 


GAC 


GCC GGA 


GAG fTr 

VXTM9 \* X I* 




GAG 


ala glu 


ser 


asp 


axes yiy 


glu leu 


gly 


giu 


271/91 










CGG CGC 


CCG 


TCG 


CGG TTG 


CGG CGA 


GGC 


TGG 


arg arg 


pro 


ser 


arg leu 


arg arg 


gly 


trp 


331/111 








TTG GCC 


GGT 


GGC 


CTT GGC 


GCA GCG 


GGT 


TAT 


leu ala 


gly 


gly 


leu gly 


ala ala 


gly 


tyr 


391/131 










TCA ATC 


GCG 


CGC 


GAG GAC 


CTT GCG 


GCC 


ATT 


ser ile 


ala 


arg 


glu asp 


leu ala 


ala 


ile 


451/151 












CAG GCA 


CCC 


GAT 


GCT GGG 


GCG ATG 


TCG 


GCT 


gin ala 


pro 


asp 


ala gly 


ala met 


ser 


ala 



SEQ ID N° 38A 
FIGURE 38A 



1/1 31/11 

CAG CGG TGA ACT GGT GGG CCC GGA TGG TTC AAG TAC GCC GTC GCA AAC TCG AGC ACA ACA 
gin arg OPA thr gly gly pro gly trp phe lys tyr ala val ala asn ser ser thr thr 
61/21 91/31 

GGA GAC GAC GGA TGG AAG GAG ATG CTG GCG CCG GCC AGC TGA ACC CTG CCG ATG CGA ATA 
gly asp asp gly trp lys glu met leu ala pro ala ser OPA thr leu pro met arg ile 
121/41 151/51 

AGT CGT CGT CTA CGG AGG TGA AGG CGG CGG ATT CGG CGG AAT CTG ACG CCG GAG CCG ACC 
ser arg arg leu arg arg OPA arg arg arg ile arg arg asn leu thr pro glu pro thr 
181/61 211/71 

AGA CTG GCC CGC AGG TGA AGG CGG CGG ATT CGG CGG AAT CTG ACG CCG GAG AGC TCG GCG 
arg leu ala arg arg OPA arg arg arg ile arg arg asn leu thr pro glu ser ser ala 
241/81 271/91 

AGG ACG CGT GCC CAG AAC AGG CCC TCG TCG AGC GGC GCC CGT CGC GGT TGC GGC GAG GCT 
arg thr arg ala gin asn arg pro ser ser ser gly ala arg arg gly cys gly glu ala 
301/101 331/111 

GGC TTG TTG GCA TTG CGG CGA CGC TGC TCG CGT TGG CCG GTG GCC TTG GCG CAG CGG GTT 
gly leu leu ala leu arg arg arg cys ser arg trp pro val ala leu ala gin arg val 
361/121 391/131 

ATT TTG CGT TGC GCT CAC ACC AGG AAA GCC AAT CAA TCG CGC GCG AGG ACC TTG CGG CCA 
ile leu arg cys ala his thr arg lys ala asn gin ser arg ala arg thr leu arg pro 
421/141 451/151 

TTG AGG CCG CTA AGG ATT GCG TTG CGG CCA CGC AGG CAC CCG ATG CTG GGG CGA TGT CGG 

481/161 Pr ° lGU 9ly arg CyS arg 

CTA GCA TGC AGA AGA TC 
leu ala cys arg arg 



SEQ ID N° 38B 



FEUILLE DE RENff»W«Jafl@9?(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



121/185 



1/1 31/11 



AGC GGT 


GAA 


CTG 


GTG GGC 


ser gly 


glu leu 


val qlv 


61/21 






GAG ACG 


ACG 


GAT 


GGA AGG 


glu thr 


thr 


asp 


cflv ara 


121/41 








GTC GTC 


GTC TAC 


GGA GGT 


val val 


val 


tyr 


alv alv 

^ J \2 j 


181/61 








GAC TGG 


CCC 


GCA 


GGT GAA 


asp trp 


pro 


ala 


alv alu 


241/81 






GGA CGC 


GTG 


CCC 


AGA ACA 


gly arg 


val 


pro 


arg thr 


301/101 








GCT TGT 


TGG 


CAT 


TGC GGC 


ala cys 


trp his 


cys gly 


361/121 






TTT TGC 


GTT 


GCG 


CTC ACA 


phe cys 


val 


ala 


leu thr 


421/141 








TGA GGC 


CGC 


TAA 


GGA TTG 


OPA gly 


arg 


OCH 


gly leu 


481/161 






TAG CAT 


GCA 


GAA 


GAT C 


AMB his 


ala 


glu 


asp 



pro asp gly ser ser thr pro ser gin thr arq 
91/31 

AGA TGC TGG CGC CGG CCA GCT GAA CCC TGC CGA 
arg cys trp arg arg pro ala glu pro cys arg 
151/51 

GAA GGC GGC GGA TTC GGC GGA ATC TGA CGC CGG 
glu gly gly gly phe gly gly il e OPA arg arg 
211/71 

GGC GGC GGA TTC GGC GGA ATC TGA CGC CGG AGA 
gly gly gly phe gly gly ile OPA arg arg arg 
271/91 

GGC CCT CGT CGA GCG GCG CCC GTC GCG GTT GCG 
gly pro arg arg ala ala pro val ala val ala 
331/111 

GAC GCT GCT CGC GTT GGC CGG TGG CCT TGG CGC 
asp ala ala arg val gly arg tro pro trp arg 
391/131 

CCA GGA AAG CCA ATC AAT CGC GCG CGA GGA CCT 
pro gly lys pro ile asn arg ala arg gly pro 
451/151 

CGT TGC GGC CAC GCA GGC ACC CGA TGC TGG GGC 
arg cys gly his ala gly thr arg cys trp gly 



GCA 


CAA 


CAG 


ala 


gin 


gin 


TGC 


GAA 


TAA 


cys 


glu 


OCH 


AGC 


CGA 


CCA 


ser 


arg 


pro 


GCT 


CGG 


CGA 


ala 


arg 


arg 


GCG 


AGG 


CTG 


ala 


arg 


leu 


AGC 


GGG 


TTA 


ser 


gly 


leu 


TGC 


GGC 


CAT 


cys 


gly 


his 


GAT 


GTC 


GGC 


asp 


val 


gly 



SEQ ID N° 38C 
FIGURE 38C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



122/185 



Sequence Rv0175 


predite par 


seq38A 










1/1 










GTG AAG 


GCG 


GCG 


GAT 


TCG gcg 


val lys 


ala 


ala 


asp 


3Ci did 


61/21 








AAG GCG 


GCG 


GAT 


TCG 


GCG GAA 


lys ala 


ala 


aso 


ser 


Qxa y J. u 


121/41 








CAG GCC 


CTC 


GTC 


GAG 


CGG CGC 


gin ala 


leu 


val 




« t y a j. y 


181/61 








GCG ACG 


CTG 


CTC 


GCG 


TTG GCC 


ala thr 


leu 


leu 


ala 


leu ala 


241/81 










CAC CAG 


GAA 


AGC 


CAA 


TPA ATP 


his gin 


glu 


ser 


gin 


ser ile 


301/101 








TGC GTT 


GCG 


GCC 


ACG 


CAG GCA 


cys val 


ala 


ala 




gin ala 


361/121 








ATC GAG 


TGT 


GGC 


ACC 


GGT GAT 


ile glu 


CVS 


y j. y 


thr 


yj.y asp 


421/141 








GAG GCG 


TAT 


CAA 


GCG 


GCC AGC 


glu ala 


tyr 


gin 


ala 


ala ser 


481/161 










CGC AAC 


AAC 


AAT 


GAC 


GGG TCG 


arg asn 


asn 


asn 


asp 


gly ser 


541/181 






ACC GAC 


TCG 


GAT 


GCC 


CAT GAA 


thr asp 


ser 


asp 


ala 


his glu 


601/201 








GGC CGC 


TAT 


AAG 


ATC 


GCC AAA 


gly arg 


tyr 


lys 


ile 


ala lys 



., 1998 (Nature 393 537-544) et contenant 
31/11 

GCC GGA GCC GAC CAG ACT GGC CCG CAG GTG 
ala gly ala asp gin thr gly pro gin val 
91/31 

GGA GAG CTC GGC GAG GAC GCG TGC CCA GAA 
gly glu leu gly glu asp ala cys pro glu 
151/51 

TTG CGG CGA GGC TGG CTT GTT GGC ATT GCG 
leu arg arg gly trp leu val gly ile ala 
211/71 

GGC GCA GCG GGT TAT TTT GCG TTG CGC TCA 
gly ala ala gly tyr phe ala leu arg ser 
271/91 

GAC CTT GCG GCC ATT GAG GCC GCT AAG GAT 
asp leu ala ala ile glu ala ala lys asp 
331/111 

GGG GCG ATG TCG GCT AGC ATG CAG AAG ATC 
gly ala met ser ala ser met gin lys ile 
391/131 

CAG GCG TCG TTG TAC ACC AGC ATG CTC GTC 
gin ala ser leu tyr thr ser met leu val 
451/151 

CAA GTG ACC GAT ATG CGC GCG GCG GTC GAG 
gin val thr asp met arg ala ala val glu 
511/171 y 

CTG GTG GCG CTC CGG GTC AAG GTG TCC AAC 
leu val ala leu arg val lys val ser asn 
571/191 

CGT CTT CGG GTC CGG ATG GCA CTG GAT GAG 
arg leu arg val arg met ala leu asp glu 
631/211 



SEQ ID N° 38D 
FIGURE 38D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

123/185 

QRF d'aprfes Cole et al., 1998 (Nature 393 537-544) Contenant Rv0175 

1/1 31/11 
TGA ACT GGT GGG C 
OPA thr gly gly e 
61/21 

CGA CGG ATG GAA < 
arg arg met glu c 
121/41 

TCG TCT ACG GAG C 
ser ser thr glu \ 
181/61 

GGC CCG CAG GTG / 
gly pro gin val J 
241/81 

GCG TGC CCA GAA C 
ala cys pro glu c 
301/101 

GTT GGC ATT GCG C 
val gly ile ala a 
361/121 

GCG TTG CGC TCA C 
ala leu arg ser t 
421/141 

GCC GCT AAG GAT 1 
ala ala lys asp c 
481/161 

ATG CAG AAG ATC P 
met gin lys ile i 
541/181 

AGC ATG CTC GTC C 
ser met leu val q 
601/201 

GCG GCG GTC GAG C 
ala ala val glu a 
661/221 

AAG GTG TCC AAC P 
lys val ser asn t 
721/241 



GGA 


TGG 


TGT 


CAA 


GTA cgc cgt 


CGC 


AAA 




GAG 


CAC 


AAC 


AGG AGA 


gly trp 


cvs 


aln 


Val ara ara 
91/31 


a rrr 
aiy 


xys 


xeu 


gxu 


Li _ 

nis 


asn 


arg 


arg 


GAT 


GCT 


GGC 


GCC 


GGC rAG PTP 






GCC 


GAT 


GCG 


AAT 


AAG 


TCG 


asp 


ala 


gly 


ala 


alv aln leu 


asn 


p£0 


oXa 


asp 


aia 


asn 


lys 


ser 










151/51 














AAG 


GCG 


GCG 


GAT 


TCG GCG GAA 


TCT 


par* 


err* 


GGA 


GCC 


GAC 


CAG 


ACT 


lys ala 


ala 


asp 


ser ala glu 


OCX 


asp 


axa 


gly 


axa 


asp 


gin thr 










211/71 
















GCG 


GCG 


GAT 


TCG 


GCG GAA TPT 


P2VP 




GGA 


GAG 


CTC 


GGC 


GAG 


GAC 


ala 


ala 


asp 


ser 


ala alu ser 


asp 


ala 


gly 


glu 


leu 


gly 


glu 


asp 










271/91 












GCC 


CTC 


GTC 


GAG 


CGG cgc cm 
wwV3 v^ijv* kA*ur 






TTG 


CGG 


CGA 


GGC 


TGG 


CTT 


ala 


leu 


val 


alu 




ser 


arg 


leu 


arg 


arg 


gly 


trp 


leu 










331/11 1 














ACG 


CTG 


CTC 


GCG 


TTP ncc cr'T* 
Uw bbl 




CTT 


GGC 


GCA 


GCG 


GGT 


TAT 


TTT 


thr 


leu 


leu 


ala 


leu ala rrl v 


gxy 


1 en 

lCU 


gly 


ala 

axa 


ala 


gly 


tyr phe 










391/1**! 
















CAG 


GAA 


AGC 


CAA 


TPA ATP PPP 




GAG 


GAC 


CTT 


GCG 


GCC 


ATT 


GAG 


gin glu 


ser 


aln 


ser ile ala 




glu 


asp 


leu 


axa 


ala 


ile alu 










451/151 
















GTT 


GCG 


GCC 


ACG 


CAG gca ppp 

V*XVJ UUA 1*1*1* 


PAT 


GCT 


GGG 


GCG 


ATG 


TCG 


GCT 


AGC 


val 


ala 


ala 


thr 


Cfln a1 A nrn 
y^ii aia ^lu 

511/171 


asp 


axa 


gly 


aia 
aia 


met 


ser 


ala 


ser 


GAG 


TGT 


GGC 


ACC 


GGT GAT TTC 


GGT 


GCC 


CAG 


GCG 


TCG 


TTG 


TAC ACC 


glu 


cys 


gly 


thr 


gly asp phe 


gly 


ala 


gin 


ala 


ser 


leu 


tyr 


thr 










571/191 














GCG 


TAT 


CAA 


GCG 


GCC AGC GTC 


CAC 


GTG 


CAA 


GTG 


ACC 


GAT 


ATG 


CGC 


ala 


tyr 


gin 


ala 


ala ser val 


his 


val 


gin 


val 


thr 


asp 


met 


arg 










631/211 














AAC 


AAC 


AAT 


GAC 


GGG TCG GTC 


GAT 


GTT 


CTG 


GTG 


GCG 


CTC 


CGG 


GTC 


asn 


asn 


asn 


asp 


gly ser val 


asp 


val 


leu 


val 


ala 


leu 


arg 


val 










691/231 














GAC 


TCG 


GAT 


GCC 


CAT GAA GTC 


GGC 


TAC 


CGT 


CTT 


CGG 


GTC 


CGG 


ATG 


asp 


ser 


asp 


ala 


his glu val 


gly 


tyr 


arg 


leu 


arg 


val 


arg 


met 










751/251 














CGC 


TAT 


AAG 


ATC 


GCC AAA CTC 


GAC 


CAG 


GTG 


ACG 


AAG 


TGA 






arg tyr 


lys 


ile 


ala lys leu 


asp 


gin 


val 


thr 


lys 


OPA 







SEQ ID N° 38F 
FIGURE 38F 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



124/185 



1/1 31/11 

ACA CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT CCC AAG GAA TGT CCG GCG CCG 
thr pro pro pro pro pro pro leu pro pro val pro phe pro lys glu cys pro ala pro 
61/21 91/31 

GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG ATC ATG GGC ATC GAC AGC AAG 
gly val met gin gly cys leu glu ser thr ser gly leu lie met gly ile asp ser lvs 
121/41 151/51 * 

ACC GCA CTG GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG GAG ATC 
thr ala leu val ala glu arg ile thr gly ala val glu glu ile 



SEQ ID N° 39A 
FIGURE 39A 



1/1 31/n 

CAC CTC CCC CCC CGC CGC CGC TGC CGC CGG TTC CCT TTC CCA AGG AAT GTC CGG CGC CGG 

^ S „^ CU PE ° Pr ° arg arg arg cys arg arg phe P ro P he P ro ar 9 asn val arg arg arq 
61/21 91/31 

GCG TGA TGC AAG GCT GCC TTG AGA GCA CCA GCG GCT TGA TCA TGG GCA TCG ACA GCA AGA 

ala OPA cys lys ala ala leu arg ala pro ala ala OPA ser trp ala ser thr ala arc 

121/41 151/51 

CCG CAC TGG TCG CCG AGC GCA TCA CCG GTG CCG TCG AGG AGA TC 

pro his trp ser pro ser ala ser pro val pro ser arg arg 



SEQ ID N° 39B 
FIGURE 39B 



1/1 
















31/11 






GAC ACC 


TCC 


CCC CCC 


GCC 


GCC 


GCT 


GCC 


GCC 


GGT TCC 


CTT 


TCC 


asp thr 


ser 


pro pro 


ala 


ala 


ala 


ala 


ala 


gly ser 


leu 


ser 


61/21 
















91/31 






GGG CGT 


GAT 


GCA AGG 


CTG 


CCT 


TGA 


GAG 


CAC 


CAG CGG 


CTT 


GAT 


gly arg 


asp 


ala arg 


leu 


pro OPA glu his 


gin arg 


leu 


asp 


121/41 
















151/51 




GAC CGC 


ACT 


GGT CGC 


CGA 


GCG 


CAT 


CAC 


CGG 


TGC CGT 


CGA 


GGA 


asp arg 


thr gly arg arg 


ala 


his 


his 


arg 


cys arg 


arg gly 



SEQ ID N° 39C 
FIGURE 39C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



125/185 



Sequence codante Rv3006 predate par Cole et al., 1998 (Nature 393 537-544) et contenant 

3eg39A 

1/1 31/11 

L CTC GCC GCG CTG TGC GCG GCA GTG CTG GTA 
' leu ala ala leu cys ala ala val leu val 
91/31 

1 CAA TCT CAG CCG TTC ACC ACC GAA CCG GAG 
t gin ser gin pro phe thr thr glu pro qlu 
151/51 

! CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT 
• pro pro pro pro leu pro pro val pro phe 

; CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG 

gin gly cys leu glu ser thr ser gly leu 
271/91 

; GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG 
i val ala glu arg ile thr gly ala val glu 
331/111 

« AAG ACG GTC ATC CQC GTG GAT CCT GCC GGT 

lys thr val ile pro val asp pro ala alv 

391/131 ' 

> CCC ACC TAC TCG CAA GAC CGG CTG ATG TAC 
pro thr tyr ser gin asp arg leu met tyr 
451/151 

> GTG GTG CGA GTG GCC GAC GGC GAC ATC CCC 
val val arg val ala asp gly asp ile pro 
511/171 

GCT GCC GGT AAC ACC GGG GCG CTG ATC TTC 

ala ala gly asn thr gly ala leu ile phe 
571/191 

GGG GAT GCT GGC GAC CCG GCG TTG GCC GCC 

gly asp ala gly asp pro ala leu ala ala 
6317211 

CGT ATC GAA CAG CCC ACC ACC ATC GGC CAG 

arg ile glu gin pro thr thr ile gly gin 
691/231 

GGC TCC GGC GGC GGC TTG TGC ATC GAT CCG 

gly ser gly gly gly leu cys ile asp pro 
751/251 

ACG CCA ACG GCG GAC CGA TTG CAG CGC ATC 

thr pro thr ala asp arg leu gin arg ile 
811/271 

ACC TGG CCG GAC AAG CCC GGC GTG GCC GGG 

thr trp pro asp lys pro gly val ala gly 
871/291 

AAC CTG ATT AAT ACC AAA CTG ACG GTG GCG 

asn leu ile asn thr lys leu thr val ala 
931/311 

ACC GGA GAA CCC GAC GTT GTC CGC AAA GAC 

thr gly glu pro asp val val arg lys asp 

991/331 F 

TCG CCG GAC GGC AAC GTC TGG GGA GCC ACC 

ser pro asp gly asn val trp gly ala thr 
1051/351 

CTC GAC GAT GTG GTG TTC CCG CTG TTC CCG 

leu asp asp val val phe pro leu phe pro 
1111/371 



ATG TGG 


ACA 


ACG 


CGG 


TTG 


GTT 


CGA 


TCC 


Met trp 


thr 


thr 


arg 


leu 


val 


arg 


ser 


61/21 












TCG AGC 


GGC 


TGC 


GCA 


CGG 


TTC 


AAC 


GAC 


ser ser 


gly 


cys 


ala 


arg 


phe 


asn 


asp 


121/41 














CTG CGG 


CCC 


CAA 


CCC 


AGC 


TCG 


ACA CCT 


leu arg 


pro 


gin 


pro 


ser 


ser 


thr 


pro 


181/61 














CCC AAG 


GAA 


TGT 


CCG 


GCG 


CCG 


GGC 


GTG 


pro lys 


glu 


cys 


pro 


ala 


pro 


gly val 


241/81 
















ATC ATG 


GGC 


ATC 


GAC 


AGC 


AAG 


ACC 


GCA 


ile met 


gly 


ile 


asp 


ser 


lys 


thr 


ala 


301/101 












GAG ATC 


TCT 


ATC 


AGC 


GCC 


GAG 


CCG AAG 


glu ile 


ser 


ile 


ser 


ala 


glu 


pro 


lys 


361/121 














GAC GGT 


GGC 


TTG 


ATG 


GAC 


ATT 


GTG 


CTG 


asp gly 


gly 


leu 


met 


asp 


ile 


val 


leu 


421/141 














GCC TAC 


ATC 


AGC 


ACG 


CCC 


ACC 


GAC 


AAC 


ala tyr 


ile 


ser 


thr 


pro 


thr 


asp 


asn 


481/161 














AAG GAC 


ATC 


CTG 


ACC 


GGC 


ATC 


CCC 


AAA 


lys asp 


ile 


leu 


thr 


gly 


ile 


pro lys 


541/181 
















ACC AGT 


CCC 


ACC 


ACG 


CTG 


GTC 


GTG ATG 


thr ser 


pro 


thr 


thr 


leu 


val 


val 


met 


601/201 
















GAT CCC 


CAA 


TCG 


TTG 


GCC 


GGT 


AAG 


GTC 


asp pro 


gin 


ser 


leu 


ala 


gly 


lys val 


661/221 














ACG CCG 


CCG 


ACG 


ACG 


GCG 


CTG 


TCT 


GGC 


thr pro 


pro 


thr 


thr 


ala 


leu 


ser 


gly 


721/241 














GTC GAC 


GGC 


TCG 


CTA 


TAT 


GTC 


GCC 


GAC 


val asp 


gly 


ser 


leu 


tyr 


val 


ala 


asp 


781/261 














ACC AAG 


AAC 


TCG 


GAG 


GTC 


TCT 


ACG 


GTA 


thr lys 


asn 


ser 


glu 


val 


ser 


thr 


val 


841/281 














TGT GCC 


GCG 


ATG 


GAC 


GGC 


ACC 


GTG 


CTG 


cys ala 


ala 


met 


asp 


gly 


thr 


val 


leu 


901/301 
















GTC CGG 


CTC 


GCG 


CCG 


TCG 


ACC 


GGT 


GCG 


val arg 


leu 


ala 


pro 


ser 


thr 


gly ala 


961/321 
















ACT CAT 


GCG 


CAT 


GCG 


TGG 


GCA 


TTA 


CGG 


thr his 


ala 


his 


ala 


trp 


ala 


leu 


arg 


1021/341 












GTC AAC 


AAG 


ACC 


GCC 


GGC 


GAC 


GCC 


GAG 


val asn lys 


thr 


ala 


gly 


asp 


ala glu 


1081/361 














CAG GGT 


GGC 


GGC 


TTC 


CCG 


CGC 


AAC 


AAC 


gin gly gly 


gly 


phe 


pro 


arg 


asn 


asn 



SEQ ID N° 39D 



FIGURE 39D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



126/185 



ORF d'apres Cole et al., 1998 (Nature 393 537-544) et contenant Rv3006 

!/l 31/11 
TAA GGC 
OCH gly 
61/21 
TTG ACC 
leu thr 
121/41 
CCG GCA 
pro ala 
181/61 
TTG GTT 
leu val 
241/81 
CGG TTC 
arg phe 
301/101 
AGC TCG 
ser ser 
361/121 
GCG CCG 
ala pro 
421/141 
AGC AAG 
ser lys 
481/161 
GCC GAG 
ala glu 
541/181 
GAC ATT 
asp ile 
601/201 
CCC ACC 
pro thr 
661/221 
GGC ATC 
gly ile 
721/241 
CTG GTC 
leu val 
781/261 
GCC GGT 
ala gly 
841/281 
GCG CTG 
ala leu 
901/301 



CAT 


TTA 


GTG 


CCG AAT 


TGG 


GGA 


TTT 


GAG CGG 




TTT 


CGC 


CAG 


his 


leu 


val 


pro asn 


trp 


gly 


phe glu arg 






arg 


gin 
















91/31 






CTG 


ACC 


AGC 


CCA CCA 


AAA 


GGC 


ccc 

CCC 


AAT TGG 


ccc 


CCC 

GCC 


ATG 


CCG 


leu 


thr 


ser 


pro pro 


lvs 


alv 


pro 


asn trp 


aXa 


axa 


met 


pro 
















151/51 








GGT 


GGC 


GGC 


GAT GCC 


CAC 


AAT 


GTC 


CGT AGC 


CH*C 

CTG 


TCG 


GTC 


ATG 


gly 


gly 


alv 


asp ala 


his 


asn 


val 


arg ser 
211/71 


1 ah 

±eu 


ser 


val 


met 


CGA 


TCC 


GGA 


CTC GCC 


GCG 


CTG 


TGC 


GCG GCA 


GTG 


CTG 


GTA 


TCG 


arg 


ser 


o;lv 


leu ala 


ala 


leu 


cys 


ala ala 
271/91 


wa 1 

val 


leu 


val 


ser 


AAC 


GAC 


GCT 


CAA TCT 


CAG 


CCG 


TTC 


ACC ACC 


C A 7i 

GAA 


CCG 


GAG 


CTG 


asn 


asp 


ala 


gin ser 


gin 


pro 


phe 


thr thr 


giu 


pro 


glu 


leu 
















331/111 








ACA 


CCT 


CCC 


CCC CCG 


CCG 


CCG 


CTG 


CCG CCG 


GI 1 


CCC 

CCC 


TTT 


CCC 


thr 


pro 


pro 


pro pro 


Dro 


pro 


leu 


pro pro 


Vol 


pro 


pne 


pro 
















391/131 






GGC 


GTG 


ATG 


CAA GGC 


TGC 


CTT 


GAG 


AGC ACC 


IV CC ' 

AGC 


GGC 


TTG 


ATC 


gly 


val 


met 


din alv 


CVS 


leu 


glu 


ser thr 


ser 


gly 


leu 


ile 
















451/151 








ACC 


GCA 


CTG 


GTC GCC 


GAG 


CGC 


ATC 


ACC GGT 


CCC 


GTC 


GAG 


GAG 


thr 


ala 


leu 


val ala 


olu 


ara 


ile 


thr gly 


did 


vai 


glu 


glu 
















511/171 






CCG 


AAG 


GTA 


AAG ACG 


GTC 


ATC 


CCC 


GTG GAT 


CCT 


CCC 




GAC 


pro 


lys 


val 


lys thr 


val 


ile 


pro 


val aso 


pro 


axa 


gly 


asp 
















571/191 






GTG 


CTG 


TCG 


CCC ACC 


TAC 


TCG 


CAA 


GAC CGG 


CTC 


Al <j 


TAC 


GCC 


val 


leu 


ser 


pro thr 


tvr 


ser 


gin 


asp arg 


leu 


met 


tyr 


ala 
















631/211 








GAC 


AAC 


CGG 


GTG GTG 


CGA 


GTG 


GCC 


GAC GGC 


w\U 




CCC 

CCC 


AAG 


asp 


asn 


arg 


val val 


arg 


val 


ala 


asp gly 




i 1 
-LXc 


pro 


lys 
















691/231 






CCC 


AAA 


GGT 


GCT GCC 


GGT 


AAC 


ACC 


GGG GCG 


CTG 


ATC 


TTC 


ACC 


pro lys 


gly 


ala ala 


gly 


asn 


thr gly ala 


leu 


ile 


phe 


thr 
















751/251 








GTG 


ATG 


ACC 


GGG GAT 


GCT 


GGC 


GAC 


CCG GCG 


TTG 


GCC 


GCC 


GAT 


val 


met 


thr 


gly asp 


ala 


gly 


asp 


pro ala 


leu 


ala 


ala 


asp 
















811/271 








AAG 


GTC 


CTG 


CGT ATC 


GAA 


CAG 


CCC 


ACC ACC 


ATC 


GGC 


CAG 


ACG 


lys val 


leu 


arg ile 


glu 


gin 


pro 


thr thr 


ile 


gly 


gin 


thr 
















871/291 






TCT 


GGC 


ATC 


GGC TCC 


GGC 


GGC 


GGC 


TTG TGC 


ATC 


GAT 


CCG 


GTC 


ser 


gly 


ile 


gly ser 


gly 


gly 


gly leu cys 


ile 


asp 


pro 


val 
















931/311 






GCC 


GAC 


CGC 


ACG CCA 


ACG 


GCG 


GAC 


CGA TTG 


CAG 


CGC 


ATC 


ACC 


ala 


asp 


arg 


thr pro 


thr 


ala 


asp 


arg leu 


gin 


arg 


ile 


thr 



SEQ ID N° 39F 
FIGURE 39F 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



127/185 



961/321 991/331 

GTC TCT ACG GTA TGG ACC TGG CCG GAC AAG CCC GGC GTG GCC GGG TGT GCC GCG ATG GAC 

T^w^ thr Val trP thr trP Pr ° aSp lys pr ° gly val ala ^ly cys ala ala met asp 
1021/341 1051/351 

GGC ACC GTG CTG GTC AAC CTG ATT AAT ACC AAA CTG ACG GTG GCG GTC CGG CTC GCG CCG 

?i^f, Val leU Val aSn l6U ile asn thr lys leu thr val ala ™l "g leu ala pro 
1081/361 1111/371 

TCG ACC GGT GCG GTC ACC GGA GAA CCC GAC GTT GTC CGC AAA GAC ACT CAT GCG CAT GCG 

i^i^«i 9ly Val 9ly glU Pr ° 3SP Val Val ar * ^ as P thr his ala his ala 
1141/381 1171/391 

TGG GCA TTA CGG ATG TCG CCG GAC GGC AAC GTC TGG GGA GCC ACC GTC AAC AAG ACC GCC 

™ /in/ eU arg met 3Sr Pr ° aSp gly asn Val tr P 9ly ala thr val asn lys thr ala 
1201/401 1231/411 

GGC GAC GCC GAG AAG CTC GAC GAT GTG GTG TTC CCG CTG TTC CCG CAG GGT GGC GGC TTC 

1261/42i ala Val Pr ° lGU Pr ° gln gly gly g ^ P he 

CCG CGC AAC AAC GAC GAC AAG ACC TGA 
pro arg asn asn asp asp lys thr OPA 



SEQ ID N° 39F (suite) 
FIGURE 39F (suite) 



1/1 

GAA GGC CTT GTT GAG CCG GCG 
glu gly leu val glu pro ala 
61/21 

TCG GTT GAA CGT GTA TGT GCC 
ser val glu arg val cys ala 
121/41 

CGT CTC GGC GCT GAC TCA GGC 
arg leu gly ala asp ser gly 
181/61 

GTG GCT TGA GGG GTT GGA ACC 
val ala OPA gly val gly thr 
241/81 

GAT CGA TGC CGC TCG CGA TGA 
asp arg cys arg ser arg OPA 
301/101 

CAG GTG GTC GTC GAC GCG AGT 
gin val val val asp ala ser 









31/11 




CAC 


GAA 


AAC 


GAT CGT 


TGT 


his 


glu 


asn 


asp arg 


cys 








91/31 




CGA 


CGA 


ATT 


GGC GGA 


GCG 


arg 


arg 


ile 


gly gly 


ala 








151/51 




CGC 


GAT 


CAG 


TGC CGA 


GTT 


arg. 


asp 


gin 


cys arg 


val 








211/71 




CAG 


AAG 


CAC 


CGG CGC 


TCG 


gin 


lys 


his 


arg arg 


ser 








271/91 




GTT 


CGA 


AGC 


GTG AGA 


GCA 


val 


arg 


ser 


val arg 


ala 








331/111 




GCC 


ATG 


GTG 


GAT C 




ala 


met 


val 


asp 





SEQ ID N° 4 OA 
FIGURE 4 OA 



GTG 


TAC 


ATT 


GGT 


GTG 


TAT GGC 


val 


tyr 


ile 


gly 


val 


tyr gly 


CGC 


CAG 


GGC 


GCG 


GGG 


CTT GAA 


arg 


gin gly ala 


gly leu glu 


GGA 


GAA 


CTC 


CGC 


AAC 


CGA TGC 


gly 


glu 


leu 


arg 


asn 


arg cys 


GCA 


TGA 


TGA 


CGT 


GCT 


GGG TGC 


ala 


OPA 


OPA 


arg 


ala 


gly cys 


TCG 


CCC 


ACT 


TCG 


CCG 


CCG GAG 


ser 


pro 


thr 


ser 


pro pro glu 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



128/185 



1/1 31/11 
AAG GCC TTG TTG AGC CGG CGC ACG AAA ACG ATC GT1 
lys ala leu leu ser arg arg thr lys thr lie va] 
61/21 91 / 31 
CGG TTG AAC GTG TAT GTG CCC GAC GAA TTG GCG GAC 
arg leu asn val tyr val pro asp glu leu ala gli 
121/41 151/51 
GTC TCG GCG CTG ACT CAG GCC GCG ATC AGT GCC GAC 
val ser ala leu thr gin ala ala ile ser ala gli 
181/61 211/71 
TGG CTT GAG GGG TTG GAA CCC AGA AGC ACC GGC GCl 
trp leu glu gly leu glu pro arg ser thr gly ale 
241/81 271/91 



301/101 ** " " 331/111 

AGG TGG TCG TCG ACG CGA GTG CCA TGG TGG ATC 
arg trp ser ser thr arg val pro trp trp ile 



SEQ ID N° 40B 
FIGURE 4 OB 



GTG 


TGT 


ACA 


TTG 


GTG 


TGT 


ATG 


GCT 


vax 


cys 


tnr 


leu 


val 


cys 


met 


ala 


CGC 


GCC 


AGG 


GCG 


CGG 


GGC 


TTG 


AAC 


arg 


ala 


arg 


ala 


arg 


gly 


leu 


asn 


TTG 


GAG 


AAC 


TCC 


GCA 


ACC 


GAT 


GCG 


leu 


glu 


asn 


ser 


ala 


thr 


asp 


ala 


CGG 


CAT 


GAT 


GAC 


GTG 


CTG 


GGT 


GCG 


arg 


his 


asp 


asp 


val 


leu 


gly 


ala 


CAT 


CGC 


CCA 


CTT 


CGC 


CGC 


CGG 


AGC 


his 


arg 


pro 


leu 


arg 


arg 


arg 


ser 



1/1 

AGG CCT TGT TGA GCC GGC GCA CGA AAA CGA 
arg pro cys .OPA ala gly ala arg lys arg 
61/21 

GGT TGA ACG TGT ATG TGC CCG ACG AAT TGG 
gly OPA thr cys met cys pro thr asn trp 
121/41 

TCT CGG CGC TGA CTC AGG CCG CGA TCA GTG 
. ser arg arg OPA leu arg pro arg ser val 
181/61 

GGC TTG AGG GGT TGG AAC CCA GAA GCA CCG 
gly leu arg gly trp asn pro glu ala pro 
241/81 

TCG ATG CCG CTC GCG ATG AGT TCG AAG CGT 
ser met pro leu ala met ser ser lys arg 
301/101 

GGT GGT CGT CGA CGC GAG TGC CAT GGT GGA 
gly gly arg arg arg glu cys his gly gly 



31/11 



TCG TTG 


TGT 


GTA 


CAT 


TGG TGT 


GTA 


TGG 


CTC 


ser leu 


cys 


val 


his 


trp cys 


val 


trp 


leu 


91/31 












CGG AGC 


GCG 


CCA 


GGG 


CGC GGG 


GCT 


TGA 


ACG 


arg ser 


ala 


pro 


gly arg gly 


ala 


OPA 


thr 


151/51 
















CCG AGT 


TGG 


AGA 


ACT 


CCG CAA 


CCG 


ATG 


CGT 


pro ser 


trp arg 


thr 


pro gin 


pro 


met 


arg 


211/71 












GCG CTC 


GGC 


ATG 


ATG 


ACG TGC 


TGG 


GTG 


CGA 


ala leu 


gly met 


met 


thr cys 


trp 


val 


arg 


271/91 










GAG AGC 


ATC 


GCC 


CAC 


TTC GCC 


GCC 


GGA 


GCA 


glu ser 


ile 


ala 


his phe ala 


ala 


gly 


ala 



TC 



SEQ ID N° 40C 
FIGURE 40C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



gtg aga 
val arg 
61/21 


gca 
ala 


teg 
ser 


ccc 
pro 


act 
thr 


teg 
ser 


ccg 
pro 


ccg 
pro 


gag 
glu 


gat eta 
asp leu 
121/41 


ctg 
leu 


get 
ala 


cgc 
arg 


act 
thr 


age 
ser 


gat 
asp 


egg 
arg 


tgc 
cys 


gcg atg 
ala met 
181/61 


cac 
his 


gcg 
ala 


ccg gcg cac ttc gat 
pro ala his phe asp 


gca 
ala 


cgc gcc 
arg ala 
241/81 


ggc 
gly 


gca 
ala 


etc 
leu 


acc 
thr 


gtt 
val 


gcc 
ala 


tat 
tyr 


gtc 
val 


ccg gtg 
pro val 
301/101 


act 
thr 


cga 
arg 


cac 
his 


ggt ctt 
gly leu 


teg 
ser 


teg 
ser 


ctg 
leu 


etc cgc 
leu arg 
361/121 


ctg 
leu 


acc 
thr 


gat 
asp 


gcc 
ala 


etc 
leu 


tac gtc 
tyr val 


gag 
glu 


acc acc 
thr thr 


gac 
asp 


gaa aga 
glu arg 


ttg gca 
leu ala 


cgc 
arg 


gcc 
ala 


tgg 
trp 



gtc 
val 


gtc 
val 


gac 
asp 


gtg 
val 


cgc 
arg 


gcg 
ala 


ttg 
leu 


teg 
ser 


gcg 
ala 


gca 
ala 


ctg 
leu 


gag 
glu 


gga 
gly 


gcg 
ala 


tgg 
trp 


gaa 
glu 


a eg 
thr 


gca 
ala 


get 
ala 


cac 
his 


gcc 
ala 



WO 99/09186 PCT/FR98/01813 

129/185 

Sequence codante Rv0549c predite par Cole et al., 1998 (Nature 393:537-544)et 
contenant seq40A 

1/1 31/11 

cag gtg 
gin val 
91/31 
tct gcg 
ser ala 
151/51 
gag gtg 
glu val 
211/71 
gat gcg 
asp ala 
271/91 
ctt get 
leu ala 
331/111 
ctg gcc 
leu ala 
391/131 
ccc teg 
pro ser 

SEQ ID N° 40D 
FIGURE 40D 

ORFd'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0549c 

1/1 31/11 

tga gtt cga age gtg aga gca teg ccc act teg ccg 

OPA val arg ser val arg ala ser pro thr ser pro 
61/21 91/31 

agt gcc atg gtg gat eta ctg get cgc act age gat 

ser ala met val asp leu leu ala arg thr ser asp 
121/41 iSi/51 

ctg get egg acc gcg atg cac gcg ccg gcg cac ttc 

leu ala arg thr ala met his ala pro ala his phe 
181/61 211/71 

ggg cgc atg cag cgc gcc ggc gca etc acc gtt gcc 

gly arg met gin arg ala gly ala leu thr val ala 
241/81 271/91 

ttg cga cag gtg ccg gtg act cga cac ggt ctt teg 

leu arg gin val pro val thr arg his gly leu ser 
301/101 331/111 

cgc cgc gac acc etc cgc ctg acc gat gcc etc tac 

arg arg asp thr leu arg leu thr asp ala leu tyr 
361/121 391/131 

ctg gtg ttg ttg acc acc gac gaa aga ttg gca cgc 

leu val leu leu thr thr asp glu arg leu ala arq 
421/141 
ggc tga 
gly OPA 

SEQ ID N° 40F 
FEUILLE DE REM^^E^REGLE 26) 



ccg 
pro 


gag 
glu 


cag 
gin 


gtg 
val 


gtc 
val 


gtc 
val 


gac 
asp 


gcg 
ala 


egg 
arg 


tgc 
cys 


tct 
ser 


gcg gtg 
ala val 


cgc 
arg 


gcg 
ala 


egg 
arg 


gat 
asp 


gca 
ala 


gag 
glu 


gtg 
val 


ttg 
leu 


teg 
ser 


gcg 
ala 


ctg 
leu 


tat 
tyr 


gtc 
val 


gat 
asp 


gcg 
ala 


gca 
ala 


ctg gag gag 
leu glu glu 


teg 
ser 


ctg 
leu 


ctt 
leu 


get 
ala 


gga 

gly 


gcg 
ala 


tgg 
trp 


teg 
ser 


gtc 
val 


gag 
glu 


ctg 
leu 


gcc 
ala 


gaa 
glu 


acg 
thr 


gca 
ala 


ggt 
gly 


gcc 
ala 


tgg 
trp 


ccc 
pro 


teg 
ser 


get 
ala 


cac 
his 


gcc 
ala 


ate 
ile 



WO 99/09186 



PCT/FR98/01813 



130/185 



1/1 

CCT GGC CGG GAC GCC TAC GTG 
pro gly arg asp ala tyr val 
61/21 

AGC GCC AAA ACG ATC AGC CCT 
ser ala lys thr ile ser pro 
121/41 

CGT CGT GAC CGT GCT GTC ACC 
arg arg asp arg ala val thr 
181/61 

GGT GTG TTG CGG AGG AGG TGT 
gly val leu arg arg arg cys 
241/81 

GCC TTG CGG GAC TGG GCA CAC 
ala leu arg asp trp ala his 









31 /I 1 




TAG 


CCC 






ACA 


AMR 




Ala 

ai a 


ala ser 


thr 








91/31 




TCG 


CGG 


ACA 


TGT CAG 


CAC 


ser 


arg 


thr 


cys gin 


his 








151/51 




ACG 


TCT 


GGT 


TAG GCT 


CGG 


thr 


ser 


gly 


AMB ala 


arg 








211/71 




GTT 


GTA 


GTG 


GGG ACG 


GCG 


val 


val 


val 


gly thr 


ala 








271/91 




GCC 


GTC 


GTC 


AGC GAT 


c 


ala 


val 


val 


ser asp 





GGA TAG CCA TTG TTG TGC GGT 
gly AMB pro leu leu cys gly 

CCG CCT TGG CCG GGA GAG CGG 
pro pro trp pro gly glu arg 

GGC GCG GGC TGG CGC GGA GGA 
gly ala gly trp arg gly gly 

GAT CGG CCG TTG GAC GCC TCG 
asp arg pro leu asp ala ser 



SEQ ID N° 41A 
FIGURE 41A 



V 1 ' 31/11 

CTG GCC GGG ACG CCT ACG TGT AGC CCG CGG CTA GO 
leu ala gly thr pro thr cys ser pro arg leu ale 
61/21 " 91/31 

GCG CCA AAA CGA TCA GCC CTT CGC GGA CAT GTC AGC 
ala pro lys arg ser ala leu arg gly his val sei 
121/41 ~ ~ ~ 151/51 

GTC GTG ACC GTG CTG TCA CCA CGT CTG GTT AGG CTC 
val val thr val leu ser pro arg leu val arg lei 
181/61 211/71 



* j ^ —j w j -d— j w —■-—«- y-**jr <xi.y 

241/81 271/91 

CCT TGC GGG ACT GGG CAC ACG CCG TCG TCA GCG ATC 

pro cys gly thr gly his thr pro ser ser ala ile 



CAG GAT 


AGC 


CAT 


TGT 


TGT GCG 


GTA 


gin asp 


ser 


his 


cys 


cys ala 


val 


ACC CGC 


CTT 


GGC 


CGG 


GAG AGC 


GGC 


thr arg 


leu 


gly 


arg 


glu ser 


gly 


GGG GCG 


CGG 


GCT 


GGC 


GCG GAG 


GAG 


gly ala 


arg 


ala 


gly 


ala glu glu 


CGG ATC 


GGC 


CGT 


TGG 


ACG CCT 


CGG 


arg ile gly 


arg 


trp 


thr pro 


arg 



SEQ ID N° 41B 
FIGURE 4 IB 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



131/185 



1/1 














TGG CCG 


GGA 


CGC 


CTA CGT 


GTA 


GCC 


CGC GGC 


trp pro 


gly 


arg 


leu arg 


val 


ala 


arg gly 


61/21 












CGC CAA 


AAC 


GAT 


CAG CCC 


TTC 


GCG 


GAC ATG 


arg gin 


asn 


asp 


gin pro 


phe ala asp met 


121/41 














TCG TGA 


CCG 


TGC 


TGT CAC 


CAC 


GTC 


TGG TTA 


ser OPA 


pro 


cys 


cys his 


his 


val 


trp leu 


181/61 












TGT GTT 


GCG 


GAG 


GAG GTG 


TGT 


TGT 


AGT GGG 


cys val 


ala 


glu 


glu val 


cys 


cys 


ser gly 


241/81 












CTT GCG 


GGA 


CTG 


GGC ACA 


CGC 


CGT 


CGT CAG 


leu ala 


gly 


leu 


gly thr 


arg arg arg gin 



31/11 
TAG CA( 
AMB hi; 
91/31 
TCA GCI 
ser ale 
151/51 
GGC TC( 
gly sei 
211/71 
GAC GGC 
asp glj 
271/91 



SEQ ID N° 41C 
FIGURE 41C 



Sequence codante Rv2975c predite par Cole et al, 1998 {Nature 393: 537-544) et 
contenant seq41A 

31/11 

gtg ggg acg gcg gat egg ccg ttg gac gec teg gee ttg egg gac tgg gca cac gee gtc 
val gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala val 
61/21 91/31 

gtc age gat ctg ate etc cac ate gac gag ate aac egg etc aat gtg ttc ccg gtc get 

Si/51 asp asp 9lu isi/sr arg leu asn va * phe pr ° * al ala 

gac tec gat ace ggc gtc aac atg ctg ttc acc atg cgt gee gcg gtc gta gaa get gat 

asp ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp 
181/61 211/71 

ttg cac gcg aat teg cag get gac gee gaa gac gtg gcg egg gtt gcg gee get etc gcg 

o!?/a^ S gln 313 3SP ala 9lu asp val ala ar 9 v *l ala ala ala leu ala 

24 1/ ol 

gec ggc gcg cgt tga 
ala gly ala arg OPA 



SEQ ID N° 41D 
FIGURE 4 ID 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



132/185 



ORF d'apres 


Cole et 


al, 1998 (Nature 393: 537-544) et contenant 


Rv2975c 






1/1 
















31/11 


















tag get 
AMB ala 
61/21 


egg 
arg 


ggc 
gly 


gcg 
ala 


ggc tgg 
gly trp 


cgc 
arg 


gga 
gly 


gga 
gly 


ggt gtg 
gly val 
91/31 


ttg 
leu 


egg 
arg 


agg 
arg 


agg 
arg 


tgt 
cys 


gtt 
val 


gta 
val 


gtg 
val 


ggg acg 
gly thr 
121/41 


gcg 
ala 


gat 
asp 


egg 
arg 


ccg ttg 
pro leu 


gac 
asp 


gcc 
ala 


teg 
ser 


gcc ttg 
ala leu 
151/51 


egg 
arg 


gac 
asp 


tgg 
trp 


gca 
ala 


cac 
his 


gcc 
ala 


gtc 
val 


gtc 
val 


age gat 
ser asp 
181/61 


ctg 
leu 


ate 
ile 


etc 
leu 


cac ate 
his ile 


gac 
asp 


gag 
glu 


ate 
ile 


aac egg 
asn arg 
211/71 


etc 
leu 


aat 
asn 


gtg 
val 


ttc ccg 
phe pro 


gtc 
val 


get 
ala 


gac 
asp 


tec gat 
ser asp 
241/81 


acc 
thr 


ggc 
gly 


gtc 
val 


aac atg 
asn met 


ctg 
leu 


ttc 
phe 


acc 
thr 


atg cgt 
met arg 
271/91 


gcc 
ala 


gcg 
ala 


gtc 
val 


gta gaa 
val glu 


get 
ala 


gat 
asp 


ttg 
leu 


cac gcg 
his ala 
301/101 


aat 
asn 


teg 
ser 


cag 
gin 


get gac 
ala asp 


gcc 
ala 


gaa 
glu 


gac 
asp 


gtg gcg 
val ala 


egg 
arg 


gtt 
val 


gcg 
ala 


gcc 
ala 


get 
ala 


etc 
leu 


gcg 
ala 


gcc 
ala 


ggc gcg 
gly ala 


cgt 
arg 


tga 
OPA 































SEQ ID N° 4 IF 
FIGURE 41F 



sequence Rv 2974C predite par Cole et* 
dans la meme phase de lecture que Seq 
apparaitre dans un cas sur trois une 
phase bserve dans 



1/1 


















ttg aac 
leu asn 
61/21 


gga 
gly 


get 
ala 


cgc 
arg 


ggc 
gly 


aac 
asn 


tec 
ser 


ggc 
gly 


gtg 

val 


gag gtg 
glu val 
121/41 


acc 
thr 


gcg 
ala 


act 
thr 


gcg 
ala 


gcc 
ala 


gcc 
ala 


gcc 
ala 


tct 
ser 


gcc etc 
ala leu 
181/61 


ggg 

gly 


gcc 
ala 


gcg 
ala 


ttg 
leu 


tgg 
trp 


cgc 
arg 


ggc 
gly 


gtc 
val 


gag gtg 
glu val 
241/81 


ccg 
pro 


gga 
gly 


act 
thr 


ate 
ile 


gtc 
val 


teg 
ser 


gtg 
val 


ctg 
leu 


gcg cac 
ala his 
301/101 


gag 
glu 


ggg 

gly 


ttg 
leu 


gcc 
ala 


ggt 
gly 


gcg 
ala 


gtc 
val 


acc 
thr 


gaa aag 
glu lys 


acc 
thr 


ccc 
pro 


gaa 
glu 


cag 
gin 


ctt 
leu 


gac 
asp 


gtg 
val 


etc 
leu 



al. (Nature 393:537-544) et pouvant etre 
4 ID. Le sequencage de cette region fait 
deletion de deux nucleotides mettant en 



31/11 


















ate ctg 
ile leu 
91/31 


tec 
ser 


cag 
gin 


ate 
ile 


ctg 
leu 


cgc 
arg 


ggg 

gly 


ate 
ile 


gca 
ala 


ggc gcg 
gly ala 
151/51 


gta 
val 


ttg 
leu 


egg 
arg 


gcg 
ala 


gtc 
val 


gac 
asp 


gcc 
ala 


aac 
asn 


gag ttg 
glu leu 
211/71 


gtc 
val 


gtc 
val 


gcg- 
ala 


teg 
ser 


atg 
met 


ggt 
gly 


ggc 
gly 


gtg 
val 


egg gcc 
arg ala 
271/91 


gcc 
ala 


gcc 
ala 


gga 
gly 


gcc 
ala 


gtc 
val 


gac 
asp 


cag 
gin 


tgc 
cys 


gcc gcc 
ala ala 
331/111 


ggt 
gly 


gac 
asp 


gcg 
ala 


gcg 
ala 


gtc 
val 


ate 
ile 


gcg 
ala 


ctg 
leu 


gcc gat 
ala asp 


gcg 
ala 


ggc 
gly 


gcg 
ala 


gtg 
val 


gac 
asp 


gcc 
ala 


ggc 
gly 


gga 
gly 



SEQ ID N° 41S 



FIGURE 41S 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



133/185 



361/121 








egg ggc 


ctg 


ctg 


gtt 


arg gly 


leu 


leu 


val 


421/141 








egg gcg 


gtc 


tac 


gaa 


arg ala 


val 


tvr 


glu 


481/161 








gee ccg 


caa 


ttc 


gag 


ala pro 


gin 


phe 


glu 


541/181 








ttg egg 


gat 


eg a 


etc 


leu arg 


asp 


ara 


leu 


601/201 








age tac 


tec 


gta 


cac 


ser tyr 


ser 


val 


his 


661/221 








gtg ggg 


eg a 


gtt 


age 


val glv 


ara 


val 


ser 


721/241 








gee ggt 


ggc 


tgg 


acg 


ala alv 


alv 
y - L Jr 


trp 


thr 


781/261 








gag ctg 


ttc 


gee 


ggg 

3 J 3 


glu leu 


phe 


ala 


alv 


841/281 






gee gee 


gat 


ate 


agt 


ala ala 


asp 


ile 


ser 


901/301 








gtg atg 


gtg 


ctg 


ccc 


val met 


val 


leu 


pro 


961/321 






gcg ate 


ggc 


tgg 


ggc 


ala ile 


gly 


tro 


alv 


1021/341 






gee gcg 


ctg 


gee 


gtg 


ala ala 


leu 


ala 


val 


1081/361 






cgt gee 


gee 


ggt 


get 


arg ala 


ala 


glv 


ala 


1141/381 




tgg gee ggt 


acc 


tgc 


trp ala 


gly 


thr 


CVS 


1201/401 






gtc gee 


gac 


gat 


gtc 


val ala 


asp 


asp 


val 


1261/421 






ggc gat 


ctg 


gtg 


acg 


gly asp 


leu 


val 


thr 


1321/441 






gaa egg 


cat 


gtg 


cac 


glu arg his 


val 


his 


1381/461 






cgc ggc 


gac 


gcg 


ctg 


arg gly asp 


ala 


leu 



ctg ctg gac gcg ttg 
leu leu asp ala leu 

ccc teg ccg cgc gcg 
pro ser pro arg ala 

gtg atg tat ctg ttg 
val met tyr leu leu 

aag gaa ttg ggt gag 
lys glu leu gly glu 

gtc cac acc gac gac 
val his thr asp asp 

egg ate gtg ate teg 
arg ile val ile ser 

egg ggc cgc gee gtg 
arg gly arg ala val 

gag ggc gee tgc gtg 
glu gly ala cys val 

gee cac cag ctg gtg 
ala his gin leu val 

aat ggc tat gtg gee 
asn gly tyr val ala 

gtc gac gtg gta ccc 
val asp val val pro 

cat gac gcg gee cgc 
his asp ala ala arg 

tec egg cac gga teg 
ser arg his gly ser 

aag ccg ggc gac ggt 
lys pro gly asp gly 

gee gcg gcg gee ate 
ala ala ala ala ile 

gtg eta att ggc gee 
val leu ile gly ala 

gac cac cat cca ggc 
asp his his pro gly 

ctg ate ggg gtc gag 
leu ile gly val glu 



391/131 








cgc tec 


acc 


ate 




arg ser 


thr 


lie 


cys 


451/151 






ttg ccg 


acc 




acg 


leu pro 


thr 


asp 


kL mm 

tnr 


511/171 








gcg gta 


tgt 


gat 


get 


ala val 


cys 


asp 


ala 


571/191 








teg gtg gec 


acc 


gec 


ser val 


ala 


He 


ala 


£"51 /oil 

631/211 








gee ggt 


gec 


gec 


gtg 


ala gly 


ala 


ala 


val 


691/231 








gcg etc 


ggt 


tec 


ggg 


ala leu 


gly 


ser 


gly 


751/251 








ctg gcg 


gtc 


gtc 


gac 


leu ala 


val 


val 


asp 


811/271 






ctg cga 


ccg 


ggt 


cca 


leu arg 


pro 


gly pro 


871/291 








egg gec 


gtg 


gta 


gac 


arg ala 


val 


val 


asp 


931/311 








gec gaa 


gaa 


ctg 


gtg 


ala glu 


glu 


leu 


val 


991/331 








gtg ccg 


acc 


gga 


teg 


val pro 


thr 


gly 


ser 


1051/351 






cag gec 


gtc 


gac 


gac 


gin ala 


val 


asp 


asp 


1111/371 






gtg cgc 


att 


gec 


acc 


val arg 


ile 


ala 


thr 


1171/391 






ctg ggt 


ate 


gcg 


ggc 


leu gly ile 


ala gly 


1231/411 






ggt ctg gtc 


gac 


ctg 


gly leu val 


asp 


leu 


1291/431 






ggc gta 


acc 


gaa 


gac 


gly val 


thr 


glu 


asp 


1351/451 






acc gag 


ctg 


gtc 


tec 


thr glu 


leu 


val 


ser 


1411/471 






tag 








AMB 









ggg cag gca cct gec 
gly gin ala pro ala 

get acc caa cgc ccc 
ala thr gin arg pro 

gca gcg gcg gac cag 
ala ala ala asp gin 

get get ccg ccc gac 
ala ala pro pro asp 

gaa gee gga ttg gcg 
glu ala gly leu ala 

acc age gga ttg ccg 
thr ser gly leu pro 

ggc gac ggt gee gee 
gly asp gly ala ala 

gac gec gtg aca ccg 
asp ala val thr pro 

acc ggc gee gcg cac 
thr gly ala ala his 

gee ggg tgt acc gcg 
ala gly cys thr ala 

atg gtg cag ggg ttg 
met val gin gly leu 

ggc tac age atg gec 
gly tyr ser met ala 

caa aag gcg ctg acc 
gin lys ala leu thr 

gac gag gtg ctg ate 
asp glu val leu ile 

ttg ttg gca teg gga 
leu leu ala ser gly 

gtg get gtc gtc ctg 
val ala val val leu 

tac cgc acc gga cac 
tyr arg thr gly his 



SEQ ID N° 41S (suite) 



FIGURE 41S (suite) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



134/185 



Seq41T comprenant seq 41F et seq 41S 
1/1 31/11 



tta ggc teg ggg cgc ggg ctg gcg egg agg agg tgt gtt gcg gag gag gtg tgt tgt agt 
leu gly ser gly arg gly leu ala arg arg arg cys val ala glu glu val cys cys ser 
AMB ala arg gly ala gly trp arg gly gly gly val leu arg arg arg cys val val val 

arg leu gly ala arg ala gly ala glu glu val cys cys gly gly gly val leu AMB trp 
61/Z1 91/31 

ggg gac ggc gga teg gee gtt gga cgc etc ggc ctt gcg gga ctg ggc aca cgc cgt cgt 
gly asp gly gly ,er ala val gly arg leu gly leu ala gly leu gly thr arg arg arg 
gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala val val 

121/4i ar9 y " 9 *** Pr ° ar is P /5 1 CyS 9ly thr 9ly hi * thr pro ser 

cag cga tct gat cct cca cat cga cga gat caa ccg get caa tgt gtt ccc ggt cgc toa 
gin arg ser asp pro pro his arg arg asp gin pro ala gin cys val pro gly arg OPA 
ser asp leu He leu his He asp glu ile asn arg leu asn val phe pro val ala asp 
i.wSi r 38r thr arg 3er thr gl * ser c *> »« arg ser leu thr 

181/61 211/71 

etc cga tac egg cgt caa cat get gtt cac cat gcg tgc cgc ggt cgt aga age tga ttt 
leu arg tyr arg arg gin his ala val his his ala cys arg gly arg arg ser OPA phe 
ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp leu 

Pr ° thr CyS CyS S6r Pt ° Cys val pto ar 9 AMB lys leu ile cys 

Z41/B1 271/91 

gca cgc gaa ttc gca ggc tga cgc cga aga cgt ggc gcg ggt tgc ggc cgc tct cgc ggc 
ala arg glu phe ala gly OPA arg arg arg arg gly ala gly cys gly arg ser arg gly 
his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala ala 

™w?n ar9 " g UU Pr ° lyS thr trp arg gl * leu arg Vr6 leu ser arg pro 
301/101 331/111 

egg cgc gcg ttg aac gga get cgc ggc aac tec ggc gtg ate ctg tec cag ate ctg cqc 
arg arg ala leu asn gly ala arg gly asn ser gly val ile leu ser gin ile leu arg 
gly ala arg OPA thr glu leu ala ala thr pro ala OPA ser cys pro arg ser cys ala 

™w*» aZg ^ 9lU M9 " 9 9ln l6U " g 3rg a3p pro val P ro "P P*° ^la arg 

361/121 391/131 

ggg ate gca gag gtg ace gcg act gcg gee gec gee tct ggc gcg gta ttg egg gcg gtc 
gly lie ala glu val thr ala thr ala ala ala ala ser gly ala val leu arg ala val 
gly ser gin arg OPA pro arg leu arg pro pro pro leu ala arg tyr cys gly arg ser 

421/14i rg ar9 ' a3P a5P ^ 9ly "Isms} 8 " ar9 9ly Ue ala 9 ^ y 9 ^ y arg 
gac gee aac gee etc ggg gee gcg ttg tgg cgc ggc gtc gag ttg gtc gtc gcg teg atg 
asp ala asn ala leu gly ala ala leu trp arg gly val glu leu val val ala ser me? 
thr pro thr pro ser gly pro arg cys gly ala ala ser ser trp ser ser arg arg trp 

at9 Pr ° " 9 9ly ^ Val Val ala arg arg arg val ^ "9 arg val alp gly 
481/161 511/171 * * 

ggt ggc gtg gag gtg ccg gga act ate gtc teg gtg ctg egg gec gec gee gga gec gtc 

gly gly val glu val pro gly thr ile val ser val leu arg ala ala ala gly ala val 

val ala trp arg cys arg glu leu ser ser arg cys cys gly pro pro pro glu pro ser 

^i5? fl ar9 9 Y 9 7 9ly " n tyr arg leU gly ala ala *y ar 9 ar 9 arg ser arg arg 
541/181 571/191 

gac cag tgc gcg cac gag ggg ttg gec ggt gcg gtc acc gec gee ggt gac gcg gcg gtc 
asp gin cys ala his glu gly leu ala gly ala val thr ala ala gly asp ala 111 111 
thr ser ala arg thr arg gly trp pro val arg ser pro pro pro val thr arg arg ser 

< n P /?n? ar9 arg gly val gly arg cys gly his arg "9 aro 0PA «9 9iy gly his 

601/201 631/211 

ate gcg ctg gaa aag acc ccc gaa cag ctt gac gtg etc gec gat gcg ggc gcg gtg gac 
lie ala leu glu lys thr pro glu gin leu asp val leu ala asp ala gly ala val aso 
ser arg trp lys arg pro pro asn ser leu thr cys ser pro met arg ala arg trp thr 

661/22 a 9 y yS aSP Pr ° ar9 ° P t 9 t/f 3 f * 319 arg CyS gly arg g ^ 9ly arg 

gee ggc gga egg ggc ctg ctg gtt ctg ctg gac gcg ttg cgc tec acc ate tgc ggg cag 
ala gly gly arg gly leu leu val leu leu asp ala leu arg ser thr ile cys 111 gin 
pro ala asp gly ala cys trp phe cys trp thr arg cys ala pro oro ser ala gly arg 
arg arg thr gly pro ala gly ser ala gly arg val ala leu his his leu arg ala gly 



SEQ ID N° 41T 



FEUILLE DE REI\#OJSEMI&f (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



135/185 



721/241 751/251 

gca cct gcc egg gcg gtc tac gaa ccc teg ccg cgc gcg ttg ccg acc gac acg get acc 
ala pro ala arg ala val tyr glu pro ser pro arg ala leu pro thr asp thr ala thr 
his leu pro gly arg ser thr asn pro arg arg ala arg cys arg pro thr arg leu pro 

™?}L? y3 Pr ° gly 9ly leU arg thr leu ala ala arg val ala a *P arg his gly tyr pro 
781/261 811/271 

caa cgc ccc gcc ccg caa ttc gag gtg atg tat ctg ttg gcg gta tgt gat get gca gcg 
gin arg pro ala pro gin phe glu val met tyr leu leu ala val cys asp ala ala ala 
asn ala pro pro arg asn ser arg OPA cys ile cys trp arg tyr val met leu gin arg 
„.w«? r ° aCg Pr ° ile arg gly a9p val ser val *ly 9ly met OPA cys cys ser gly 

841/281 871/291 

gcg gac cag ttg egg gat cga etc aag gaa ttg ggt gag teg gtg gcc ate gcc get get 
ala asp gin leu arg asp arg leu lys glu leu gly glu ser val ala ile ala ala ala 
arg thr ser cys gly ile asp ser arg asn trp val ser arg trp pro ser pro leu leu 

90?/30? r ° 9 y 9ly U »SJxf A 9ly * ly hLa 3rg arg C * 3 3 « 

ccg ccc gac age tac tec gta cac gtc cac acc gac gac gcc ggt gcc gcc gtg gaa gcc 
pro pro asp ser tyr ser val his val his thr asp asp ala gly ala ala val glu ala 
arg pro thr ala thr pro tyr thr ser thr pro thr thr pro val pro pro trp lys pro 

o« /« arg 9 arg thr arg pr ° arg arg arg ar 9 cys arg arg gly ser arg 

961/321 991/331 

gga ttg gcg gtg ggg cga gtt age egg ate gtg ate teg gcg etc ggt tec ggg acc age 
gly leu ala val gly arg val ser arg ile val ile ser ala leu gly ser gly thr ser 
asp trp arg trp gly glu leu ala gly ser OPA ser arg arg ser val pro gly pro ala 

ioS5iS y 9 y 9 y Pr ° " P ar9 a9p leU gly ala arg P ha arg asp gin arg 

1021/341 1051/351 * 

gga ttg ccg gcc ggt ggc tgg acg egg ggc cgc gcc gtg ctg gcg gtc gtc gac ggc gac 
gly leu pro ala gly gly trp thr arg gly arg ala val leu ala val val L P gly Lp 
asp cys arg pro val ala gly arg gly ala ala pro cys trp arg ser ser thr ala thr 
in «w-, a i a 9 y arg trP 3313 ala gly Pr ° arg arg ala gly g ly arg arg arg arg arg 

1081/361 1111/371 

ggt gcc gcc gag ctg ttc gcc ggg gag ggc gcc tgc gtg ctg cga ccg ggt cca gac gcc 
gly ala ala glu leu phe ala gly glu gly ala cys val leu arg pro gly pro asp ala 
val pro pro ser cys ser pro gly arg ala pro ala cys cys asp arg val gin thr pro 

n^/W* " 9 Val aig arg gly glY arg leU arg ala ala thr g ly ser arg arg arg 
1141/381 1171/391 

gtg aca ccg gcc gcc gat ate agt gcc cac cag ctg gtg egg gcc gtg gta gac acc ggc 
val thr pro ala ala asp He ser ala his gin leu val arg ala val val asp thr gly 
OPA his arg pro pro ile ser val pro thr ser trp cys gly pro trp AMB thr pro ala 

„ a3 ^m r 9 Y " 9 ^ tyr 9ln ° yS Pr ° Pr ° ala gly ala gly arg 9ly arg his arg arg 
1201/401 1231/411 

gcc gcg cac gtg atg gtg ctg ccc aat ggc tat gtg gcc gcc gaa gaa ctg gtg gcc ggg 
ala ala his val met val leu pro asn gly tyr val ala ala glu glu leu val ala glv 
pro arg thr OPA trp cys cys pro met ala met trp pro pro lys asn trp trp pro glv 

, aSP gly *** ala 9ln trp leu C * 3 gl * ar * ar 9 ar 3 thr gly gly arg val 

1261/421 1291/431 

tgt acc gcg gcg ate ggc tgg ggc gtc gac gtg gta ccc gtg ccg acc gga teg atg gtg 
cys thr ala ala ile gly trp gly val asp val val pro val pro thr gly ser met val 
val pro arg arg ser ala gly ala ser thr trp tyr pro cys arg pro asp arg trp cys 

,« y L!f? g 9 y a3P arg leU gly arg arg arg gl * thr "9 ala as P arg ile asp gly ala 
1321/441 1351/451 

cag ggg ttg gcc gcg ctg gcc gtg cat gac gcg gcc cgc cag gcc gtc gac gac ggc tac 
gin gly leu ala ala leu ala val his asp ala ala arg gin ala val asp asp gly tyr 
arg gly trp pro arg trp pro cys met thr arg pro ala arg pro ser thr thr ala thr 

, 9 y ar9 9ly arg 313 ° PA atg gly pr ° pro gl * arg arg ar 9 «g leu gin 
1331/461 1411/471 

age atg gcc cgt gcc gcc ggt get tec egg cac gga teg gtg cgc att gcc acc caa aag 
ser met ala arg ala ala gly ala ser arg his gly ser val arg ile ala thr gin lys 
ala trp pro val pro pro val leu pro gly thr asp arg cys ala leu pro pro lys arg 
his gly pro cys arg arg cys phe pro ala arg ile gly ala his cys his pro lys gly 



SEQ ID N° 41T (suite 1) 
FEUILLE clWMlWmtl& 26) 



WO 99/09186 



PCT/FR98/01813 



136/185 

1441/481 1471/491 

gcg ctg acc tgg gcc ggt acc tgc aag ccg ggc gac ggt ctg ggt ate gcg ggc gac gag 

n», ttr ^ gly n thr Cy3 ly3 Pr ° 9ly "P leu &y 'la g£y asp III 
arg OPA pro gly pro val pro ala ser arg ala thr val trp val ser arg ala tL arc, 

IsS/sS" " 9 ^ UU 9ly 5 ^ 5 t! 9 9ly tyr ^ arg^Sy 

gtg ctg ate gtc gee gac gat gtc gcc gcg gcg gcc ate ggt ctg gtc gac ctg ttg ttg 

Va; le .™ llS Val aU "? " P Val 319 ala ala ala leu val Lp leu ill "u 

cys OPA ser ser pro thr net ser pro arg arg pro ser val trp ser thr cys ty 9 £» 

i S «/ 5 a i P ar9 ar9 ^ CyS arg arg 9ly 9ly Ms ser 9l v arg pro val C-al gly 
iDbi/DZi 1591/531 

gca teg gga ggc gat ctg gtg acg gtg eta att ggc gcc ggc gta acc gaa gac gtg get 
ala ser gly gly asp leu val thr val leu ile gly ala gly val thr glu asp val ala 
his arg glu ala ile trp OPA arg cys OCH leu ala pro ala OCH pro lys thr trp leu 

162i/5?l y ^ ^ ^ a V£stl g ^ a ^ ^ ^ g Lg ^ g ^ Cy3 

gtc gtc ctg gaa egg cat gtg cac gac cac cat cca ggc acc gag ctg gtc tec tac cgc 

~™ Vt g ^ Val a3P 1X13 Pr ° * l * thr leu val »« tyr a^g 
ser ser trp asn gly met cys thr thr thr ile gin ala pro ser trp ser pro thr ala 

gly ala ^ aU Pr ° Pr ° 36r arg his ^ ala Sy leu P £u pro Us 
1681/561 1711/571 

acc gga cac cgc ggc gac gcg ctg ctg ate ggg gtc gag tag 

thr gly his arg gly asp ala leu leu ile gly val glu AMB 

pro asp thr ala ala thr arg cys OPA ser gly 3 er ser 

arg thr pro arg arg arg ala ala asp arg gly arg val 



SEQ ID N° 41T (suite 2) 
FIGURE 41T (suite 2) 

1/1 31/11 

GCC GGT AAC GCC GCG TCC GAG TGC TAT CCG 
ala gly asn ala ala ser gin cys tvr nro 
61/21 

GGC GCC CCG GTC GGC CGC GGC CGG C 
gly ala pro val gly arg gly arg e 
121/41 

TAT CGA GGT GGA AGC GGA CGG TGT 1 
tyr arg gly gly ser gly arg cys t 
181/61 

TGC TCA TCG GAA CCC GCG ACG CAC I 
cys ser ser glu pro ala thr his t 
241/81 

GCT CTT GCA GTG ACC TGA TGA TGA C 
ala leu ala val thr OPA OPA OPA \ 
301/101 

CAA TGC AGT AAG TTT ACA CAA ACG C 
gin cys ser lys phe thr gin thr c 
361/121 



CCG 


TCC GCC 


GGA 


CCG 


CCC 


GAA 


ACA 


TCA 


GCG 


GCG 


pro 


ser ala 


gly 


pro 


pro 


glu 


thr 


ser 


ala 


ala 




91/31 
















CGA 


CCC GCT 


CCA 


CCT 


GGC 


CAT 


CAG 


CGA 


CCA 


GGT 


arg 


pro ala 
151/51 


pro 


pro 


gly 


his 


gin 


arg 


pro 


gly 


GAT 


GCA CGC 


CCA 


ACT 


TGC 


CGG 


CGA 


TCG 


CGG 


CGA 


asp 


ala arg 
211/71 


pro 


thr 


cys 


arg 


arg 


ser 


arg 


arg 


ATG 


CCC GCA 


GCA 


CCG 


CAC 


GAC 


GGC 


GCC 


CCA 


CCG 


met 


pro ala 


ala 


pro 


his 


asp 


gly 


ala 


pro 


pro 




271/91 












TCA 


CCC CCA 


TAA 


GGC 


TCG 


TCG 


GCT 


GCG 


CCT 


GAG 


ser 


pro pro 


OCH 


gly 


ser 


ser 


ala 


ala 


pro 


glu 




331/111 














TTG 


TAA AAA 


CCT 


GCG 


GAG 


GTG 


GGG 


TCT 


ATG 


GCC 


leu 


OCH lys 


pro 


ala 


glu 


val 


gly 


ser 


met 


ala 




391/131 














CTG 


CCC TTG 


TCG 


GAT 


C 












leu 


pro leu 


ser 


asp 















SEQ ID N° 42A 



FIGURE 42A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



137/185 



1 

!/l 31/11 

CCG GTA ACG CCG CGT CCC AGT GCT ATC CGT CCG CCG GAC CGC CCG AAA CAT CAG CGG CGG 
pro val thr pro arg pro ser ala ile arg pro pro asp arg pro lys his gin arg arg 
bl/21 91/31 

GCG CCC CGG TCG GCC GCG GCC GGG CTC GAC CCG CTC CAC CTG GCC ATC AGC GAC CAG GTT 
ala pro arg ser ala ala ala gly leu asp pro leu his leu ala ile ser asp gin val 
121/41 151/51 

ATC GAG GTG GAA GCG GAC GGT GTT GGG ATG CAC GCC CAA CTT GCC GGC GAT CGC GGC GAT 

ni?/£ U ^ glU aSP gly Val gly met his ala 9ln leu ala gly asp arg gly asp 

181/61 211/71 ^ 

GCT CAT CGG AAC CCG CGA CGC ACA CAA TGC CCG CAG CAC CGC ACG ACG GCG CCC CAC CGG 

^n/^ S arg 3Sn Pr ° ar9 arg thr gln CyS pro gln his ar <* thr thr ala pro his arq 
241/81 271/91 y 

CTC TTG CAG TGA CCT GAT GAT GAC ACT CAC CCC CAT AAG GCT CGT CGG CTG CGC CTG AGC 

301/101 9ln ° PA Pr ° aSP asp aSp thr his ?3?/ni lys ala arg arg leu arg leu ser 

AAT GCA GTA AGT TTA CAC AAA CGG ACT TGT AAA AAC CTG CGG AGG TGG GGT CTA TGG CCA 

val ser leu his lys ar * thr cvs ^ asn leu arg arg trp gly leu trp pro 
361/121 391/131 
ACA AAC GTG GCA ATG CCG GGC AGC CTC TGC CCT TGT CGG ATC 
thr asn val ala met pro gly ser leu cys pro cys arg ile 



1/1 

CGG TAA CGC CGC GTC CCA GTG 
arg OCH arg arg val pro val 
61/21 

CGC CCC GGT CGG CCG CGG CCG 
arg pro gly arg pro arg pro 
121/41 

TCG AGG TGG AAG CGG ACG GTG 
ser arg trp lys arg thr val 
181/61 

CTC ATC GGA ACC CGC GAC GCA 
leu ile gly thr arg asp ala 
241/81 

TCT TGC AGT GAC CTG ATG ATG 
ser cys ser asp leu met met 
301/101 

ATG CAG TAA GTT TAC ACA AAC 
met gln OCH val tyr thr asn 
361/121 

CAA ACG TGG CAA TGC CGG GCA 
gln thr trp gln cys arg ala 



SEQ ID N° 42B 
FIGURE 42B 









31/11 




CTA 


TCC 


GTC 


CGC CGG 


ACC 


leu 


ser 


val 


arg arg 


thr 








91/31 




GGC 


TCG 


ACC 


CGC TCC 


ACC 


gly 


ser 


thr 


arg ser 


thr 








151/51 




TTG 


GGA 


TGC 


ACG CCC 


AAC 


leu gly 


cys 


thr pro 


asn 








211/71 




CAC 


AAT 


GCC 


CGC AGC 


ACC 


his 


asn 


ala 


arg ser 


thr 








271/91 




ACA 


CTC 


ACC 


CCC ATA 


AGG 


thr 


leu 


thr 


pro ile 


arg 








331/111 




GGA CTT 


GTA 


AAA ACC 


TGC 


gly leu 


val 


lys thr 


cys 








391/131 




GCC 


TCT 


GCC 


CTT GTC 


GGA 


ala 


ser 


ala 


leu val 


gly 



GCC 
ala 


CGA AAC ATC 
arg asn ile 


AGC 
ser 


GGC GGG 
gly gly 


TGG 
trp 


CCA TCA 
pro ser 


GCG ACC 
ala thr 


AGG 
arg 


TTA 
leu 


TTG 
leu 


CCG 
pro 


GCG 
ala 


ATC 
ile 


GCG 
ala 


GCG 
ala 


ATG 
met 


GCA 
ala 


CGA 
arg 


CGG 
arg 


CGC 
arg 


CCC 
pro 


ACC 
thr 


GGC 

gly 


CTC 
leu 


GTC 
val 


GGC 
gly 


TGC 
cys 


GCC 
ala 


TGA 
OPA 


GCA 
ala 


GGA 
gly 


GGT GGG GTC TAT 
gly gly val tyr 


GGC CAA 
gly gln 


TC 















SEQ ID N° 42C 



FIGURE 42C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

138/185 

Sequence codante Rv2622 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq42A: 

1/1 31/11 
atg gcc aac aaa cgt ggc aat gcc ggg cag cct ctg 
Met ala asn lys arg gly asn ala gly gin pro leu 
61/21 91/31 
cac atg cag ggg cac tgg ctg ctg gcc egg ctg ggc 
his met gin gly his trp leu leu ala arg leu gly 
121/41 151/51 

i ctg ctg gcc cgc gcc gag 
: leu leu ala arg ala glu 
211/71 

: cgc acc gca gcc gaa ate 
r arg thr ala ala glu ile 
271/91 

: ccc aac gcg gcc aac ctg 

> pro asn ala ala asn leu 
331/111 

: gac gcg gcc gat acc gga 
: asp ala ala asp thr gly 
391/131 

\ ctg acc atg caa ggc aac 
: leu thr met gin gly asn 
451/151 

r agg ccg ggt ggc cgc tac 
i arg pro gly gly arg tyr 
511/171 

r cag gtc cgc acc gac ctg 
t gin val arg thr asp leu 
571/191 

r ctg acc gtt gcg gaa tgg 

> leu thr val ala glu trp 
631/211 

: gtc acc get tec atg gcg 
. val thr ala ser met ala 
691/231 

r ggt gcg ctg egg ttc gcc 
i gly ala leu arg phe ala 
751/251 

f ttg atg cgc cac aca ttc 
t leu met arg his thr phe 
811/271 

^ cac aaa ccg cac gtc gat teg tga 

ala val ala ile val ala his lys pro his val asp ser OPA 

SEQ ID N° 42D 
FIGURE 42D 



y wu y ci Ck 


etc 


z\ r- 


egg. 


val glu 


leu 


thr 


arg 


181/61 

X O X/ U X 








^ty y i«ci 


ccg 


ggc 


ctg 


leu ala 


pro 


gxy 


1 All 


Z4 JL/ O X 








fit* ct rrnn 


gcg 


gag 


age 


va 1 a 1 m 

vax y X 


did 


y 1U 


ser 








y y y a t_ 


gtc 


egg 


gtc 


crlv asn 


val 


arg 


vox 


361/121 








nfr Sk t* e* 
y i« \~ dLU 


ggc 


gag 


gcg 


val ile 




glu 


ala 


421/141 

X/ XIX 








gag gcg 


gcg 


egg 


gtg 


glu ala 


ala 


arg 


val 


481/161 








ccg gac 


gac 


gtc 


gca 


pro asp 


asp 


val 


ala 


541/181 








aag gtc 


aat 


gcg 


cgt 


lys val 


asn 


ala 


arg 


601/201 






ctg gtc 


gtc 


gaa 


cac 


leu val 


val 


glu 


his 


661/221 






get gac 


gaa 


ggc 


etc 


ala asp 


glu 


gly 


leu 


721/241 








gcg cgt 


egg 


cga 


gtc 


ala arg 


arg 


arg 


val 


781/261 








gcc gtc 


gcc 


att 


gtc 


ala val 


ala 


ile 


val 



ccc 
pro 


ttg 
leu 


teg 
ser 


gat 
asp 


cga 
arg 


gac 
asp 


gac 
asp 


gac 
asp 


aag 
lys 


egg 
arg 


gtg 
val 


ctg 
leu 


cgt 
arg 


ccc 
pro 


ggc 
gly 


ggc 
gly 


gtg 
val 


acc 
thr 


gac 
asp 


gcc 
ala 


gac 
asp 


gtg 
val 


etc 
leu 


gag 
glu 


ttg 
leu 


gcc 
ala 


cgc 
arg 


aac 
asn 


ccg 
pro 


egg 
arg 


teg 
ser 


tac 
tyr 


gtc 
val 


cga 
arg 


cac 
his 


gtt 
val 


etc 
leu 


gcc 
ala 


ggc 
gly 


cgc 
arg 


tta 
leu 


tec 
ser 


gac 
asp 


gcc 
ala 


age 
ser 


gcc 
ala 


gat 
asp 


gtc 
val 


gcg 
ala 


get 
ala 


aaa 
lys 


cac 
his 


a eg 
thr 


ate 
ile 


gtc 
val 


gcc 
ala 


gcg 
ala 


att 
ile 


cac 
his 


gaa 
glu 


eta 
leu 


gcg 
ala 


ctg 
leu 


gtg 
val 


egg 
arg 


cag 
gin 


teg 
ser 


ctg 
leu 


gcc 
ala 


cgc 
arg 


gcg 
ala 


etc 
leu 


teg 
ser 


cac 
his 


etc 
leu 


tta 
leu 


gcg 
ala 


ggc 
gly 


cat 
his 


gga 
gly 


ttg 
leu 


tta 
leu 


caa 
gin 


ccg 
pro 


cga 
arg 


egg 
arg 


gtg 
val 


ate 
ile 


gga 
gly 


aac 
asn 


ctg 
leu 


etc 
leu 


ate 
ile 


eat 
his 


cgt 
arg 


gcc 
ala 


cgc 
arg 


agg 
arg 


cat 
his 


cgt 
arg 


gaa 
glu 


cgc 
arg 


ttg 
leu 


aca 
thr 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



139/185 



ORF d'apres Cole et al., 1998 (Nature 



1/1 



taa aaa 


cct 


Qcq 


aaa 


ata 


aaa 


tct 


atg 


gee 


OCH lys 


pro 


ala 


alu 


val 


alv 


ser 


met 


al a 

did 


61/21 
















ccc ttg 


teg 


gat 


cga 


aac 


aac 

*J H W 


gac 


cac 


atg 


pro leu 


ser 


asD 


ara 


asp 


asp 




hi q 


met 


121/41 














aaa caa 


ata 


eta 


cgt 


ccc 


ggc 


ggc 


gtc 


gaa 


lvs ara 

J **** 3 


val 


leu 


arg 


pro 


gxy 


giy 


val 


glu 


181/61 














ata acc 


gac 


gec 


fi z± r* 
yaw. 


gtg 


etc 


gag 


ctg 


gca 


val thr 


asp 


ala 


asp 


val 


leu 


glu 


leu 


aia 


241/81 
















tta acc 


cac 


aac 


ccg 




teg 




gtg 


ggg 


leu ala 


ara 


asn 


Dro 


arg 


ser 


ft/** 

tyr 


val 
val 


gly 


301/101 
















ate caa 


cac 


gtt 


etc 


gee 


ggc 


cgc 


ggc 


gac 


val arg 


his 


val 


leu 


ala 


gxy 


a X, g 


gly 


asp 


361/121 












tta tec 


aac 


gee 


age 


gec 


gat 


gtc 


gtc 


dCC 


leu ser 


asD 


ala 


ser 


ala 


a o £J 


Val 


Val 


xxe 


421/141 
















oca act 


aaa 


cac 


a eg 


ate 






gag 


gcg 


ala ala 


lvs 


his 


thr 


ile 


val 


ala 


glu 


ala 
ala 


481/161 
















aca att 

****** 


cac 


gaa 


eta 




ctg 


gtg 


ccg 


gac 


ala ile 


his 


alu 


leu 


ala 


leu 


val 




asp 


541/181 














egg cag 


tea 


eta 


gee 


cgc 






dag 


gtc 


ara qln 


ser 


leu 


ala 


arg 




leu 


lys 


vra 1 

vax 


601/201 














tea cac 


etc 


tta 


yeg 


ggc 


Cat 


gga 


ccg 


gtc 


ser his 


leu 


leu 


ala 


gly 


his 


gly 


leu 


val 


661/221 
















ttg tta 


caa 


ccg 


cga 


egg 


gtg 


ate 


get 


gac 


leu leu 


gin 


pro 


arg 


arg 


val 


ile 


ala 


asp 


721/241 














gga aac 


ctg 


etc 


ate 


cat 


cgt 


gec 


gcg 


cgt 


gly asn 


leu 


leu 


ile 


his 


arg 


ala 


ala 


arg 


781/261 














cgc agg 


cat 


cgt 


gaa 


cgc 


ttg 


aca 


gec 


gtc 


arg arg 


his 


arg 


glu 


arg 


leu 


thr 


ala 


val 


841/281 
















teg tga 


















ser OPA 



















: 537-544) et contenant Rv2622 



31/11 
















aac aaa 
asn lys 
91/31 


cgt 
arg 


ggc 
gly 


aat 
asn 


gee 
ala 


ggg 

gly 


cag 
gin 


cct ctg 
pro leu 


cag ggg 
gin gly 
151/51 


cac 
his 


tgg 
trp 


ctg 
leu 


ctg 
leu 


gee 
ala 


egg 
arg 


ctg ggc 
leu gly 


etc acc 
leu thr 
211/71 


egg 
arg 


aca 
thr 


ctg 
leu 


ctg 
leu 


gec 
ala 


cgc 
arg 


gee gag 
ala glu 


ccg ggc 
pro gly 
271/91 


ctg 
leu 


ggc 
gly 


cgc 
arg 


acc 
thr 


gca 
ala 


gee 
ala 


gaa ate 
glu ile 


gcg gag 
ala glu 
331/111 


age 
ser 


gat 
asp 


ccc 
pro 


aac 
asn 


gcg 
ala 


gee 
ala 


aac ctg 
asn leu 


gtc egg 
val arg 
391/131 


gtc 
val 


acc 
thr 


gac 
asp 


gcg 
ala 


gee 
ala 


gat 
asp 


acc gga 
thr gly 


ggc gag 
gly glu 
451/1 51 


gcg 
ala 


atg 
met 


ctg 
leu 


acc 
thr 


atg 
met 


caa 
gin 


ggc aac 
gly asn 


gcg egg 
ala arg 

511/171 


gtg 
val 


ctg 
leu 


agg 
arg 


ccg 
pro 


ggt 
gly 


ggc 

gly 


cgc tac 
arg tyr 


gac gtc 
asp val 
571/191 


gca 
ala 


gag 
glu 


cag 
gin 


gtc 
val 


cgc 
arg 


acc 
thr 


gac ctg 
asp leu 


aat gcg 
asn ala 
631/211 


cgt 
arg 


ccg 
pro 


ctg 
leu 


acc 
thr 


gtt 
val 


gcg 
ala 


gaa tgg 
alu trD 


gtc gaa 
val glu 
691/231 


cac 
his 


gtt 
val 


gtc 
val 


acc 
thr 


get 
ala 


tec 
ser 


atg gcg 
met ala 


gaa ggc 
glu gly 
751/251 


etc 
leu 


ctg 
leu 


ggt 
gly 


gcg 
ala 


ctg 
leu 


egg 
arg 


ttc gec 
phe ala 


egg cga 
arg arg 
811/271 


gtc 
val 


ctg 
leu 


ttg 
leu 


atg 
met 


cgc 
arg 


cac 
his 


aca ttc 
thr phe 


gec att 
ala ile 


gtc 
val 


gcg 
ala 


cac 
his 


aaa 
lys 


ccg 
pro 


cac 
his 


gtc gat 
val asp 



SEQ ID N° 42F 
FIGURE 42F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



140/185 



1/1 

ate gcg cgt gac ate 
lie ala arg asp ile 
61/21 

gtt gtt tea gcg ggc 
val val ser ala gly 
121/41 

aag att aag gtc gcg 
lys ile lys val ala 
181/61 

gtt ctg cac cgc cat 
val leu his arg his 
241/81 

ctg ace ggg ttg gcg 
leu thr gly leu ala 



gat gac cag ggt egg 
asp asp gin gly arg 

gac gtg gtg cat ttg 
asp val val his leu 

ggc atg age tat ccg 
gly met ser tyr pro 

ccg cac tgg aat cgc 
pro his trp asn arg 

gcg ttc ggg tec gga 
ala phe gly ser gly 



31/11 

ctg tgt ctg gac gtc 
leu cys leu asp val 
91/31 

cgt taa etc gcg egg 
arg OCH leu ala arg 
151/51 

gag aat gtc ctg gee 
glu asn val leu ala 
211/71 

tta ate tgg ccc gtc 
leu ile trp pro val 
271/91 

ttc gtc aac teg aca 
phe val asn ser thr 



ggc ggt cga acg gta 
gly gly arg thr val 

age tgg cgt ccc caa 
ser trp arg pro gin 

get ggc gag cag gtc 
ala gly glu gin val 

gtg gtg ctg gtc ttg 
val val leu val leu 

cct tgg cag cag ate 
pro trp gin gin ile 



SEQ ID N° 43A 
FIGURE 43A 



1/1 

teg cgc 
ser arg 
61/21 
ttg ttt 
leu phe 
121/41 
aga tta 
arg leu 
181/61 
ttc tgc 
phe cys 
241/81 
tga ccg 
OPA pro 



gtg aca 
val thr 

cag .egg 
gin arg 

agg teg 
arg ser 

ace gee 
thr ala 

ggt tgg 
gly trp 



teg atg 
ser met 

gcg acg 
ala thr 

egg gca 
arg ala 

ate cgc 
ile arg 

egg cgt 
arg arg 



ace agg 
thr arg 

tgg tgc 
trp cys 

tga get 
OPA ala 

act gga 
thr gly 

teg ggt 
ser gly 



gtc ggc 
val gly 

att tgc 
ile cys 

ate egg 
ile arg 

ate get 
ile ala 

ccg gat 
pro asp 



31/11 
tgt gtc 
cys val 
91/31 
gtt aac 
val asn 
151/51 
aga atg 
arg met 
211/71 
taa tct 
OCH ser 
271/91 
teg tea 
ser ser 



tgg acg teg 
trp thr ser 


gcg gtc 
ala val 


gaa 
glu 


egg 
arg 


tag 
AMB 


teg cgc gga 
ser arg gly 


get 
ala 


ggc 
gly 


gtc ccc 
val pro 


aaa 
lys 


tec tgg ccg 
ser trp pro 


ctg 
leu 


gcg 
ala 


age 
ser 


agg 
arg 


teg 
ser 


ggc ccg teg 
gly pro ser 


tgg tgc 
trp cys 


tgg 
trp 


tct 
ser 


tgc 
cys 


act cga cac 
thr arg his 


ctt 
leu 


ggc 
gly 


age 
ser 


aga 
arg 


tc 



SEQ ID N° 43B 
FIGURE 43B 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



141/185 



1/1 31/11 
cgc gcg tga cat cga tga cca ggg teg get gtg tct 
arg ala OPA his arg OPA pro gly ser ala val ser 
61/21 " 91/31 

tgt ttc age ggg cga cgt ggt gca ttt gcg tta act 
cys phe ser gly arg arg gly ala phe ala leu thr 
121/41 151/51 
gat taa ggt cgc ggg cat gag eta tec gga gaa tgt 
asp OCH gly arg gly his glu leu ser gly glu cys 
181/61 211/71 
tct gca ccg cca tec gca ctg gaa teg ctt aat ctg 
ser ala pro pro ser ala leu glu ser leu asn leu 
241/81 271/91 
gac egg gtt ggc ggc gtt egg gtc egg att cgt caa 
asp arg val gly gly val arg val arg ile arg gin 



SEQ ID N° 43C 
FIGURE 43C 



gga 
gly 


cgt egg cqo tco 
arg arg arg ser 


aac 
asn 


net t* 

gly 


aye 

ser 


cgc 
arg 


gcg gag ctg gcg 
ala glu leu ala 


tec 
ser 


cca 
pro 


aaa 
lys 


cct 
pro 


ggc cgc tgg cga 
gly arg trp arg 


gca 
ala 


ggt 
gly 


cgt 
arg 


gcc 
ala 


cgt cgt ggt get 
arg arg gly ala 


ggt 
gly 


ctt 
leu 


get 
ala 


etc. 
leu 


gac acc ttg gca 
asp thr leu ala 


gca 
ala 


gat 
asp 


c 



Sequence codante Rv3278c 
contenant seq43A: 



1/1 



atg age 
Met ser 
61/21 


tat 
tyr 


ccg 
pro 


gag 
glu 


aat 
asn 


gtc 
val 


cac tgg 
his trp 
121/41 


aat 
asn 


cgc 
arg 


tta 
leu 


ate 
ile 


tgg 
trp 


ttc ggg 
phe gly 
181/61 


tec 
ser 


gga 
gly 


ttc 
phe 


gtc 
val 


aac 
asn 


gcg gtc 
ala val 
241/81 


ate 
ile 


tgg 
trp 


ggg 

gly 


ate 
ile 


tgg 
trp 


age tgg 
ser trp 
301/101 


ctg 
leu 


acc 
thr 


aca 
thr 


cat 
his 


ttc 
phe 


ctg acc 
leu thr 
361/121 


cgc 
arg 


age 
ser 


ggg 

gly 


ate 
ile 


gac 
asp 


egg ate 
arg ile 
421/141 


ttc 
phe 


gag 
glu 


egg 
arg 


att 
ile 


ttt 
phe 


ccg etc 
pro leu 
481/161 


gag 
glu 


ttc 
phe 


tac 
tyr 


aac 
asn 


att 
ile 


gtt ttc 
val phe 


gac 

asp 


acc 
thr 


ctg 
leu 


ggc 
gly 


tec 
ser 



ite par Cole et al., 1998 









31/11 






ctg 


gcc 


get 


ggc gag 


cag 


gtc 


leu 


ala 


ala 


gly glu 


gin val 








91/31 






ccc 


gtc 


gtg 


gtg ctg 


gtc 


ttg 


pro 


val 


val 


val leu 


val 


leu 








151/51 






teg 


aca 


cct 


tgg cag 


cag 


ate 


ser 


thr 


pro 


trp gin 


gin 


ile 








211/71 






ttg 


gtg 


ate 


gtc ggc 


tgg 


etc 


leu 


val 


ile 


val gly 


trp leu 








271/91 






gtg 


gtg 


acc 


aac egg 


egg 


gtg 


val 


val 


thr 


asn arg 


arg 


val 








331/111 






ata 


ccg 


eta 


gca egg 


ate 


aac 


ile 


pro 


leu 


ala arg 


ile 


asn 








391/131 






cgc 


acc 


ggg 


acg ttg 


att 


ate 


arg 


thr 


gly 


thr leu 


ile 


ile 








451/151 






ccg 


cgc 


ctg 


egg gag 


gtg 


cat 


pro 


arg 


leu 


arg glu 


val 


his 








511/171 






gac 


gag 


teg 


ccc age 


tga 




asp 


glu 


ser 


pro ser 


OPA 





(Nature 393:537-544) et 



gtt 
val 


ctg 
leu 


cac 
his 


cgc 
arg 


cat 
his 


ccg 
pro 


ctg 
leu 


acc 
thr 


ggg 

gly 


ttg 
leu 


gcg 
ala 


gcg 
ala 


get 
ala 


aag 
lys 


aac 
asn 


gtg 
val 


att 
ile 


cac 
his 


acg 
thr 


ctg 
leu 


tgg 
trp 


cca 
pro 


ttc 
phe 


ctg 
leu 


atg 
met 


ttc 
phe 


egg 
arg 


cat 
his 


ggt 
gly 


gtg 
val 


age 
ser 


gtg 
val 


gag 
glu 


ttc 
phe 


egg 
arg 


gac 
asp 


gag 
glu 


tec 
ser 


gcg 
ala 


tea 

ser 


caa 
gin 


gat 
asp 


gcg 
ala 


ttg 
leu 


ctg 
leu 


tat 
tyr 


cac 
his 


gag 
glu 



SEQ ID N° 43D 



FIGURE 43D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



142/185 



ORF d'apres Cole et al. # 1998 (Nature 393:537-544) et contenant Rv3278c 



1/1 



61/21 
aat gtc 
asn val 
121/41 



181/61 
gtc aac 
val asn 
241/81 



301/101 



361/121 



421/141 



481/161 
aac att 
asn ile 
541/181 
ggc tec 
gly ser 



gcg 
ala 


egg 
arg 


age 
ser 


tgg 
trp 


cgt 
arg 


ccc 
pro 


caa 
gin 


aag 
lys 


ctg 
leu 


gec 
ala 


get 
ala 


ggc 
gly 


gag 
glu 


cag 
gin 


gtc 
val 


gtt 
val 


ccc 
pro 


gtc 
val 


gtg 
val 


gtg 
val 


ctg 
leu 


gtc 
val 


ttg 
leu 


ctg 
leu 


teg 
ser 


aca 
thr 


cct 
pro 


tgg 
trp 


cag 
gin 


cag 
gin 


ate 
ile 


get 
ala 


tta 
leu 


val 


ate 
ile 


gtc 
val 


gly 


tgg 
trp 


etc 
leu 


acg 
thr 


gtg 
val 


gtg 
val 


ace 
thr 


aac 
asn 


egg 
arg 


egg 
arg 


gtg 
val 


atg 
met 


ata 
ile 


ccg 
pro 


eta 
leu 


gca 
ala 


egg 
arg 


ate 
ile 


aac 
asn 


age 
ser 


cgc 
arg 


ace 
thr 


ggg 

gly 


acg 
thr 


ttg 
leu 


att 
ile 


ate 
ile 


gag 
glu 


ccg 
pro 


cgc 
arg 


ctg 
leu 


egg 
arg 


gag 
glu 


gtg 
val 


cat 
his 


gcg 
ala 


gac 
asp 


gag 
glu 


teg 
ser 


ccc 
pro 


age 
ser 


tga 
OPA 







31/11 
att aag 
ile lys 
91/31 
ctg cac 
leu his 
151/51 
ace ggg 
thr gly 
211/71 
aag aac 
lys asn 
271/91 
ctg tgg 
leu trp 
331/111 
ttc egg 
phe arg 
391/131 
gtg gag 
val glu 
451/151 
tec gcg 
ser ala 
511/171 
ttg ctg 
leu leu 



gtc 
val 


gcg ggc 
ala gly 


atg 
met 


acre 
ser 


tat 
tyr 


ccg gag 
pro glu 


cgc 
arg 


cat 
his 


ccg 
pro 


cac 
his 


taa 
trp 


aat 
asn 


cgc 
arg 


tta 
leu 


ttg 
leu 


gcg 
ala 


gcg 
ala 


ttc 
phe 


aaa 
yyy 

gly 


tec 
ser 


gga ttc 
gly phe 


gtg 
val 


att 
ile 


cac 
his 


gcg 
ala 


gtc 
val 


ate 
ile 


tgg 
trp 


ggg 

gly 


cca 
pro 


ttc ctg 
phe leu 


age 
ser 


tgg 
trp 


ctg 
leu 


acc 
thr 


aca 
thr 


cat 
his 


ggt gtg 
gly val 


ctg 
leu 


ace 
thr 


cgc 
arg 


age 
ser 


ggg 

gly 


ttc 
phe 


egg 
arg 


gac 
asp 


egg 
arg 


ate 
ile 


ttc 
phe 


gag egg 
glu arg 


tea 
ser 


caa 
gin 


gat 
asp 


ccg 
pro 


etc 
leu 


gag 
glu 


ttc 
phe 


tac 
tyr 


tat 
tyr 


cac 
his 


gag 
glu 


gtt 
val 


ttc 
phe 


gac 
asp 


acc 
thr 


ctg 
leu 



SEQ ID N° 43F 
FIGURE 43F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



143/185 

1/1 31/11 

gcc aag atg gat gtc tac caa cgc acc gcc gcc ggc tgg cag ccg etc aag acc ggt ate 

ala lys met asp val tyr gin arg thr ala ala gly trp gin pro leu lys thr gly ile 
61/21 91/ 31 

acc acc cat ate ggt teg gcg ggc atg gcg ccg gaa gcc aag age gga tat ccg gcc act 

thr thr his ile gly ser ala gly met ala pro glu ala lys ser gly tyr pro ala thr 
121/41 151/51 

ccg atg ggg gtt tac age ctg gac tec get ttt gg< 

pro met gly val tyr ser leu asp ser ala phe glj 
181/61 ^ 211/71 

ttg ccg tat acc caa gtc gga ccc aat cac tgg tgt 

leu pro tyr thr gin val gly pro asn his trp trj 
241/81 271/91 



ccg atg ggg gtt tac age ctg gac tec get ttt ggc acc gcg ccg aat ccc ggt ggc ggg 

pro met gly val tyr ser leu asp ser ala phe gly thr ala pro asn pro gly gly llv 
181/61 211/71 y * 

ttg ccg tat acc caa gtc gga ccc aat cac tgg tgg agt ggc gac gac aat age ccc acc 

tyr thr 9ln Val 9ly pr ° asn his trp trp ser 9ly asp asp asn ser pro thr 
241/81 271/91 

ttt aac tec atg cag gtc tgt cag aag tec cag tgc ccg ttc age acg gcc gac age gag 

phe asn ser met gin val cys gin lys ser gin cys pro phe ser thr ala asp ser glu 

301/101 331/111 " 

aac ctg caa ate ccg cag tac aag cat teg gtc gtg atg ggc gtc aac aag gcc aag gtc 

asn leu gin ile pro gin tyr lys his ser val val met gly val asn lys ala lys val 

361/121 391/131 

cca ggc aaa ggc tec gcg ttc ttc ttt cac acc acc gac ggc ggg ccc acc gcg ggt tgt 

pro gly lys gly ser ala phe phe phe his thr thr asp gly gly pro thr ala gly cys 
421/141 J 
gtg gcg ate 
val ala ile 

SEQ ID N° 44A 
FIGURE 44A 



1/1 

cca aga tgg atg 
pro arg trp met 
61/21 

cca ccc ata teg 
pro pro ile ser 
121/41 

cga tgg ggg ttt 
arg trp gly phe 
181/61 

tgc cgt ata ccc 
cys arg ile pro 
241/81 

tta act cca tgc 
leu thr pro cys 
301/101 

acc tgc aaa tec 
thr cys lys ser 
361/121 

cag gca aag get 
gin ala lys ala 
421/141 
tgg cga tc 
trp arg 



tct acc aac gca 
ser thr asn ala 

gtt egg egg gca 
val arg arg ala 

aca gcc tgg act 
thr ala trp thr 

aag teg gac cca 
lys ser asp pro 

agg tct gtc aga 
arg ser val arg 

cgc agt aca age 
arg ser thr ser 

ccg cgt tct tct 
pro arg ser ser 







31/11 


ccg 


ccg 


ccg get 


pro 


pro 


pro ala 






91/31 


tgg 


cgc 


egg aag 


trp 


arg 


arg lys 






151/51 


ccg 


ctt 


ttg gca 


pro 


leu 


leu ala 






211/71 


ate 


act 


ggt gga 


ile 


thr 


gly gly 






271/91 


agt 


ccc 


agt gcc 


ser 


pro 


ser ala 






331/111 


att 


egg 


teg tga 


ile 


arg 


ser OPA 






391/131 


ttc 


aca 


cca ccg 


phe 


thr 


pro pro 



ggc age cgc tea 
gly ser arg ser 

cca aga gcg gat 
pro arg ala asp 

ccg cgc cga ate 
pro arg arg ile 

gtg gcg acg aca 
val ala thr thr 

cgt tea gca egg 
arg ser ala arg 

tgg gcg tea aca 
trp ala ser thr 

acg gcg ggc cca 
thr ala gly pro 



aga 
arg 


ccg 
pro 


gta 
val 


tea 
ser 


ate 
ile 


egg 
arg 


cca 
pro 


etc 
leu 


ccg 
pro 


gtg 
val 


gcg ggt 
ala gly 


ata 
ile 


gcc 
ala 


cca 
pro 


cct 
pro 


ccg 
pro 


aca 
thr 


gcg 
ala 


aga 
arg 


agg 
arg 


cca 
pro 


agg 
arg 


tec 
ser 


ccg 
pro 


egg 
arg 


gtt 
val 


gtg 
val 



SEQ ID N° 44B 
FEUILLE DE REMP^ggE^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



144/185 



1/1 

caa gat gga tgt eta 
gin asp gly cys leu 
61/21 

cac cca tat egg ttc 
his pro tyr arg phe 
121/41 

gat ggg ggt tta cag 
asp gly gly leu gin 
181/61 

gee gta tac cca agt 
ala val tyr pro ser 
241/81 

taa etc cat gca ggt 
OCH leu his ala gly 
301/101 

cct gca aat ccc gca 
pro ala asn pro ala 
361/121 

agg caa agg etc cgc 
arg gin arg leu arg 
421/141 
ggc gat c 
gly asp 



cca acg cac cgc cgc 
pro thr his arg arg 

ggc ggg cat ggc gee 
gly gly his gly ala 

cct gga etc cgc ttt 
pro gly leu arg phe 

egg acc caa tea ctg 
arg thr gin ser leu 

ctg tea gaa gtc cca 
leu ser glu val pro 

gta caa gca ttc ggt 
val gin ala phe gly 

gtt ctt ctt tea cac 
val leu leu ser his 



31/11 

egg ctg gca gee get 
arg leu ala ala ala 
91/31 

gga age caa gag egg 
gly ser gin glu arg 
151/51 

tgg cac cgc gee gaa 
trp his arg ala glu 
211/71 

gtg gag tgg cga cga 
val glu trp arg arg 
271/91 

gtg ccc gtt cag cac 
val pro val gin his 
331/111 

cgt gat ggg cgt caa 
arg asp gly arg gin 
391/131 

cac cga egg egg gee 
his arg arg arg ala 



caa gac egg tat cac 
gin asp arg tyr his 

ata tec ggc cac tec 
ile ser gly his ser 

tec egg tgg egg gtt 
ser arg trp arg val 

caa tag ccc cac ctt 
gin AMB pro his leu 

ggc cga cag cga gaa 
gly arg gin arg glu 

caa ggc caa ggt ccc 
gin gly gin gly pro 

cac cgc ggg ttg tgt 
his arg gly leu cys 



SEQ ID N° 44C 
FIGURE 44C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



145/185 

Sequence codante Rv0309 predite par Cole et al., 1998 (Nature 393:537-544) 
contenant Seq44A: 



1/1 












atg age 
Met ser 
61/21 


cga 
are 


etc 
leu 


eta 
leu 


get 
ala 


ttg 


etc gcg 
leu ala 
121/41 


cca 
pro 


gtg 
val 


age 
ser 


ctg 
leu 


gee 
ala 


act cag 
thr gin 
181/61 


gtg 
val 


gtt 
val 


teg 
ser 


gtg 
val 


gtg 
val 


cgc ace 
arg thr 
241/81 


gee 
ala 


gee 
ala 


ggc 
alv 

3 J 


tgg 
tro 


cag 
gin 


ggc atg 
gly met 
301/101 


gcg 
ala 


ccg 
pro 


gaa 
glu 


gee 
ala 


aag 
j.ys 


gac tec 
asp ser 
361/121 


get 
ala 


ttt 
phe 


ggc 
alv 


ace 
thr 


gcg 
ala 


ccc aat 
pro asn 
421/141 


cac 
his 


tgg 
trp 


tgg 

trp 


agt 
ser 


ggc 
gly 


cag aag 
gin lys 
481/161 


tec 
ser 


cag 
gin 


tgc 
cys 


ccg 
pro 


ttc 
phe 


aag cat 
lys his 
541/181 


teg 
ser 


gtc 
val 


gtg 
val 


atg 
met 


ggc 
gly 


ttc ttt 
phe phe 
601/201 


cac 
his 


ace 
thr 


ace 
thr 


gac 
asp 


ggc 
gly 


ctg gtg 
leu val 


cag 
gin 


ate 
ile 


ate 
ile 


cgt 
arg 


tgg 
trp 









Ji/ 11 




ctg 


tgc 


get 


gcg gta 


tgc 


leu 


cys 


aia 


ala val 


cys 








y i/ j i 




gtc 


gtc 


aac 


ccg tgg 


ttc 


Val 


Vdl 


asn 


pro trp 


phe 








1 CI /CI 

101/ 01 




n na 

gga 


ace 


ggc 


ggt teg 


acg 


y±y 


thr 
nil. 


gly 


gly ser 


thr 








Oil /It 
£11/ 11 




ccg 


etc 


aag 


acc ggt 


ate 


pro 


leu 


lys 


tnr gly 


ile 








on i / qi 
£ * if yi 




age 


gga 


cat 


ccg gee 


act 


ser 


gly 


tyr 


pro ala 


thr 








joi/ m 




ccg 


aat* 


ccc 


ggt ggc 


ggg 


pro 


asn 


pro 


gly gly 


gly 








1Q1 /ill 

jyi/ iji 






rr a r* 


aat* 

eta L. 


age ccc 


acc 


asp 


asp 


asn 


ser pro 


thr 








451/151 




age 


acg 


gee 


gac age 


gag 


ser 


thr 


ala 


asp ser 


glu 








511/171 




gtc 


aac 


aag 


gee aag 


gtc 


val 


asn 


lys 


ala lys 


val 








571/191 




ggg 


ccc 


ace 


gcg ggt 


tgt 


gly 


pro 


thr 


ala gly 


cys 








631/211 




ctg 


egg 


cct 


ggt gcg 


gtg 


leu 


arg 


pro 


gly ala 


val 



SEQ ID N° 44D 
FIGURE 44D 



acg 
thr 


ggc tgc 
gly cys 


gtt 
val 


get 
ala 


gtg 
val 


gtt 
val 


gcg 
ala 


aac teg 
asn ser 


gtc 
val 


ggc 
gly 


aat 
asn 


gee 
ala 


gee 
ala 


aag atg 
lys met 


gat 
asp 


gtc 
val 


tac 
tyr 


caa 
gin 


acc 
thr 


acc cat 
thr his 


ate 
ile 


ggt 
gly 


teg 
ser 


gcg 
ala 


ccg atg ggg 
pro met gly 


gtt 
val 


tac 
tyr 


age 
ser 


ctg 
leu 


ttg 
leu 


ccg tat 
pro tyr 


acc 
thr 


caa 
gin 


gtc 
val 


gga 
gly 


ttt 
phe 


aac tec 
asn ser 


atg 
met 


cag 
gin 


gtc 
val 


tgt 
cys 


aac 
asn 


ctg caa 
leu gin 


ate 
ile 


ccg 
pro 


cag 
gin 


tac 
tyr 


cca ggc aaa 
pro gly lys 


ggc 
gly 


tec 
ser 


gcg 
ala 


ttc 
phe 


gtg 
val 


gcg ate 
ala ile 


gac 
asp 


gat 
asp 


gee 
ala 


acg 
thr 


ate 
ile 


gcg ate 
ala ile 


gee 
ala 


aag 
lys 


taa 
OCH 





FEUILLE DE REM PLACE M ENT (REGLE 26) 



WO 99/09186 PCT/FR98/01813 

146/185 

ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0309 
1/1 

tga gcg atg age cga etc eta get 1 
OPA ala met ser arg leu leu ala J 
61/21 

gtg gtt etc gcg cca gtg age ctg < 
val val leu ala pro val ser leu < 
121/41 

aat gee act cag gtg gtt teg gtg c 
asn ala thr gin val val ser val <v 
181/61 

tac caa cgc acc gee gee ggc tgg c 
tyr gin arg thr ala ala gly trp c 
241/81 

teg gcg ggc atg gcg ccg gaa gee £ 
ser ala gly met ala pro glu ala 1 
301/101 

age ctg gac tec get ttt ggc acc c 
ser leu asp ser ala phe gly thr a 
361/121 

gtc gga ccc aat cac tgg tgg agt g 
val gly pro asn his trp trp ser c 
421/141 

gtc tgt cag aag tec cag tgc ccg t 
val cys gin lys ser gin cys pro p 
481/161 

cag tac aag cat teg gtc gtg atg g 
gin tyr lys his ser val val met q 
541/181 

gcg ttc ttc ttt cac acc acc gac g 
ala phe phe phe his thr thr asp q 
601/201 

gee acg ctg gtg cag ate ate cgt t 
ala thr leu val gin ile ile arg t 
661/221 
taa 
OCH 

SEQ ID N° 44F 
FIGURE 44F 





31/11 


















ctg 


tgc get 
cys ala 
91/31 


gcg 
ala 


gta 
val 


tgc 
cys 


acg 
thr 


ggc 
gly 


tgc 
cys 


gtt 

val 


get 
ala 


gtc 

Val 


gtc aac 
val asn 
151/51 


ccg 
pro 


tgg 
trp 


ttc 
phe 


gcg 
ala 


aac 
asn 


teg 
ser 


gtc 
val 


ggc 
gly 


gga 
gj.y 


acc ggc 
thr gly 
211/71 


ggt 
gly 


teg 
ser 


acg 
thr 


gee 
ala 


aag 
lys 


atg 
met 


gat 
asp 


gtc 
val 


ccg 
pro 


etc aag 
leu lys 
271/91 


acc ggt 
thr gly 


ate 
ile 


acc 
thr 


acc 
thr 


cat 
his 


ate 
ile 


ggt 
gly 


age 
ser 


gga tat 
gly tyr 
331/111 


ccg 
pro 


gec 
ala 


act 
thr 


ccg 
pro 


atg 
met 


ggg 
giy 


gtt 

val 


tac 
tyr 


ccg 
pro 


aat ccc 
asn pro 
391/131 


ggt ggc 
gly gly 


ggg 

gly 


ttg 
leu 


ccg 
pro 


tat 
tyr 


acc caa 
thr gin 


gac 
asp 


gac aat 
asp asn 
451/151 


age 
ser 


ccc 
pro 


acc 
thr 


ttt 
phe 


aac 
asn 


tec 
ser 


atg 
met 


cag 
gin 


age 
ser 


acg gec 
thr ala 
511/171 


gac 
asp 


age 
ser 


gag 
glu 


aac 
asn 


ctg 
leu 


caa 
gin 


ate 
ile 


ccg 
pro 


gtc 
val 


aac aag 
asn lys 
571/191 


gec aag 
ala lys 


gtc 
val 


cca 
pro 


ggc 
gly 


aaa 
lys 


ggc 
gly 


tec 
ser 


ggg 

gly 


ccc acc 
pro thr 
631/211 


gcg 
ala 


ggt 
gly 


tgt 
cys 


gtg 
val 


gcg 
ala 


ate 
ile 


gac 
asp 


gat 
asp 


ctg 
leu 


egg cct 
arg pro 


ggt gcg 
gly ala 


gtg 
val 


ate 
ile 


gcg 
ala 


ate 
ile 


gec 
ala 


aag 
lys 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



147/185 



Fragment clone en fusion avec phoA 



1/1 

gat etc 
asp leu 
61/21 
tec ggt 
ser gly 
121/41 
ggt cct 
gly pro 
181/61 
ate gtg 
ile val 
241/81 
gtg cga 
val arg 
301/101 
teg gtg 
ser val 
361/121 
ggt gtg 
gly val 
421/141 
tec ccg 
ser pro 
481/161 
ctg gtc 
leu val 
541/181 
acc tgc 
thr cys 
601/201 
ggc gcg 
gly ala 
661/221 
teg get 
ser ala 
721/241 
age cac 
ser his 
781/261 
acc gtc 
thr val 
841/281 
ate gee 
ile ala 
901/301 
egg aca 
arg thr 



ccc 
pro 

age 
ser 

tgc 
cys 

cca 
pro 

ccc 
pro 

aag 
lys 

gag 
glu 

agg 
arg 

ate 
ile 

tgt 
cys 

ttg 
leu 

gee 
ala 

att 
ile 

agg 
arg 

aac 
asn 

age 
ser 



gga cac 
gly his 

cag agg 
gin arg 

cac teg 
his ser 

gac egg 
asp arg 

agg atg 
arg met 

ccc aac 
pro asn 

age agg 
ser arg 

cca egg 
pro arg 

agt egg 
ser arg 

tgc cac 
cys his 

etc agt 
leu ser 

gtt acc 
val thr 

ggg gcg 
gly ala 

gca tea 
ala ser 

gcg egg 
ala arg 

cga tga 
arg OPA 



cag 
gin 

cac 
his 

cga 
arg 

gca 
ala 

gcg 
ala 

egg 
arg 

a eg 
thr 

cct 
pro 

gcg 
ala 

cac 
his 

teg 
ser 

teg 
ser 

cgc 
arg 

ccg 
pro 

tgt 
cys 

ggc 
gly 



gtc ate 
val ile 

cag cat 
gin his 

tec ttg 
ser leu 

tgc cgc 
cys arg 

aat get 
asn ala 

egg tac 
arg tyr 

ttg tec 
leu ser 

tga gcg 
OPA ala 

ate get 
ile ala 

tgg ccg 
trp pro 

gcg gee 
ala ala 

acg gee 
thr ala 

aaa gtc 
lys val 

agg egg 
arg arg 

cct cct 
pro pro 

cgc ccg 
arg pro 



egg cga 
arg arg 

cag caa 
gin gin 

gga tga 
gly OPA 

gtc ggc 
val gly 

egg ggg 
arg gly 

aac cgc 
asn arg 

teg teg 
ser ser 

egg gga 
arg gly 

agg cgc 
arg arg 

ggc gee 
gly ala 

gac ggc 
asp gly 

gcg acc 
ala thr 

teg gtg 
ser val 

cgc tec 
arg ser 

cat gtg 
his val 

cgc tgg 
arg trp 



31/11 
gat ggt 
asp gly 
91/31 
cat cgc 
his arg 
151/51 
egg tgg 
arg trp 
211/71 
aag ctg 
lys leu 
271/91 
tea ccg 
ser pro 
331/111 
cac gee 
his ala 
391/131 
cga ccg 
arg pro 
451/151 
agg atg 
arg met 
511/171 
gga aag 
gly lys 
571/191 
ccg gga 
pro gly 
631/211 
age gee 
ser ala 
691/231 
gee tgc 
ala cys 
751/251 
ccc ctg 
pro leu 
811/271 
ata teg 
ile ser 
871/291 
atg aac 
met asn 
931/311 
acg ggg 
thr gly 



gat cga ggc teg gac ccg cag gca 
asp arg gly ser asp pro gin ala 

gat ggc cag cat gee gcg ccg teg 
asp gly gin his ala ala pro ser 

ggc ata get age gcg cac cag gtc 
gly ile ala ser ala his gin val 

teg ggc gcg ggt tag age ggt age 
ser gly ala gly AMB ser gly ser 

gcg aag tgg tag ccg egg atg atg 
ala lys trp AMB pro arg met met 

cga ttg tec tea ccg ttg gtc tec 
arg leu ser ser pro leu val ser 

get age agt egg egg gee aac gee 
ala ser ser arg arg ala asn ala 

tgc aat tea gtc aac teg aag tag 
cys asn ser val asn ser lys AMB 

ccg ctg cgt tgc aag ccc agt acc 
pro leu arg cys lys pro ser thr 

tag ccg tac gee act ccg age att 
AMB pro tyr ala thr pro ser ile 

gtg gtg teg gcg gee teg gee tgt 
val val ser ala ala ser ala cys 

cag ccg cgc cgc egg atg tgc tec 
gin pro arg arg arg met cys ser 

ggg tag cgc ate gcg teg aca tac 
gly AMB arg ile ala ser thr tyr 

ctg ggc ggc aga teg atg agg aat 
leu gly gly arg ser met arg asn 

cga tgc gtg ctt gcg cac cag tat 
arg cys val leu ala his gin tyr 

ctt gta gcg tat ggc cgt ttc cgc 
leu val ala tyr gly arg phe arg 



SEQ ID N° 45ZA 
FIGURE 45ZA 

FEUILLE DE REM PLACEM ENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



148/185 



961/321 

tea get cgt cgc tgc 
ser ala arg arg cys 
1021/341 

gat tga cct cgt ate 
asp OPA pro arg ile 
1081/361 

att acg tga cag tct 
ile thr OPA gin ser 
1141/381 

atg ctt gac cag ate 
met leu asp gin ile 
1201/401 

cgt ggc ggg ggc ttc 
arg gly gly gly phe 
1261/421 

ate ate ggt ctg ggg 
ile ile gly leu gly 
1321/441 

ttc ccg ata etc age 
phe pro ile leu ser 
1381/461 

acc ggt cct egg ttg 
thr gly pro arg leu 
1441/481 

cag cgt cgt acc aag 
gin arg arg thr lys 



ggc gee gee ggg ata 
gly ala ala gly ile 

ate tga gtt agt tgc 
ile OPA val ser cys 

gtc ggc aag gag gga 
val gly lys glu gly 

gag age get etc tac 
glu ser ala leu tyr 

cgc gca ccg acc gcg 
arg ala pro thr ala 

atg ttg gtt tec ggc 
met leu val ser gly 

gtt ttc ggt ttt gtc 
val phe gly phe val 

tec ggc agg atg gat 
ser gly arg met asp 

ggg gee ggg ggc tea 
gly ala gly gly ser 



991/331 

gaa teg ccc gcg aac 
glu ser pro ala asn 
1051/351 

ccg cgc aat ggg cat 
pro arg asn gly his 
1111/371 

cgc atg cca etc tec 
arg met pro leu ser 
1171/391 

gee gaa gat ccc aag 
ala glu asp pro lys 
1231/411 

egg egg cgc ctg cag 
arg arg arg leu gin 
1291/431 

gtg gcg ttc aaa gag 
val ala phe lys glu 
1351/451 

gtg atg ttc ggt ggt 
val met phe gly gly 
1411/471 

cgt ggc gga teg get 
arg gly gly ser ala 
1471/491 

ttc acc age cgt atg 
phe thr ser arg met 



cag 
gin 


tgg 
trp 


tac 
tyr 


ggc 
gly 


gca 
ala 


ccg 
pro 


cgt 
arg 


gtt 
val 


ate 
ile 


ggt 
gly 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


ggc 
gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


get 
ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


gaa 
glu 


gat 
asp 


c 







SEQ ID N° 45ZA (suite) 
FIGURE 45ZA (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCTAFR98/01813 



149/185 



fragment seq45ZA en decalage moins 1 pour la phase de lecture 



1/1 


















31/11 


















ate tec 
ile ser 
61/21 


ccg 
pro 


yaw 

asp 


a f* c 
a ww 

thr 


agg 
arg 


ser 


uce 

ser 


ggc gag 
gly glu 


atg gtg 
met val 
91/31 


ate 
ile 


gag 
glu 


get 
ala 


egg 
arg 


acc 
thr 


cgc 
arg 


agg 
arg 


cat 
his 


ccg gta 
pro val 
121/41 


gcc 
ala 


aga 
arg 


ygc 

gly 


a w w 

thr 


a n 
ay w 

ser 


a LL> 

ile 


age 
ser 


aac 
asn 


ate gcg 
ile ala 
151/51 


atg 
met 


gcc 
ala 


age 
ser 


atg 
met 


ccg 
pro 


cgc 
arg 


cgt 
arg 


egg 
arg 


n f r* ft* t" 
y w w w u u 

val leu 
181/61 


gee 
ala 


d w U 

thr 


wy w 

arg 


ya w 

asp 


cct 
pro 


tgg 
trp 


gat 
asp 


gac 
asp 


ggt ggg 
gly gly 
.211/71 


gca 
ala 


tag 
AMB 


eta 
leu 


gcg 
ala 


cgc 
arg 


acc 
thr 


agg 
arg 


tea 
ser 


tea tac 
ser cys 
241/81 


caa 

way 

gin 


ace 
thr 


aaa 

yyy 
gly 


cat 
his 


gcc 
ala 


gey 

ala 


teg gca 
ser ala 


age tgt 
ser cys 
271/91 


egg 
arg 


gcg 
ala 


egg 
arg 


gtt 
val 


aga 
arg 


gcg 
ala 


gta 
val 


gcg 
ala 


l« y w yav< 

cys asp 
301/101 


cca 
pro 


gga 
gly 


tgg 
trp 


cga 
arg 


dug 
met 


etc 
leu 


ggg ggt 
gly gly 


cac egg 
his arg 
331/111 


cga 
arg 


agt 
ser 


ggt 
gly 


age 
ser 


cgc 
arg 


gga 
gly 


tga 
OPA 


tgt 
cys 


cnet t" na 
wy y wya 

arg OPA 
361/121 


ser 


cca 
pro 


acc 
thr 


ggc 
gly 


ggt 
gly 


aca 
thr 


acc 
thr 


gcc 
ala 


acg cec 
thr pro 
391/131 


gat 
asp 


tgt 
cys 


cct 
pro 


cac 
his 


cgt 
arg 


tgg 
trp 


tct 
ser 


ccg 
pro 


ywy i-yy 

val trp 
421/141 


a na 
ay a 

arg 


y wci 

ala 


gga 
gly 


cgt 
arg 


cgc 
cys 


cct 
pro 


cgt 
arg 


cgc 
arg 


gac egg 
asp arg 
451/151 


eta 
leu 


gca 
ala 


gtc 
val 


ggc 
gly 


ggg 

gly 


cca 
pro 


acg 
thr 


cct 
pro 


cec cga 
pro arg 
481/161 


yy w 

gly 


r*a r* 
vfl w 

his 


rrrrr 

ggc 
gly 


www 

leu 


gag 
glu 


cgc 
arg 


ggg gaa 

gly glu 


gga tgt 
gly cys 
511/171 


gca 
ala 


att 
ile 


cag 
gin 


tea 
ser 


act 
thr 


cga 
arg 


agt age 
ser ser 


taa tea 
trp ser 
541/181 


tea 
ser 


gtc 
val 


aaa 

yyy 
gly 


cga 
arg 


teg 
ser 


eta 
w wa 

leu 


ggc gcg 
gly ala 


yaa aye 

glu ser 
571/191 


cgc 
arg 


cgc 
cys 


gtt 
val 


gca 
ala 


age 
ser 


cca 
pro 


gta 
val 


cca 
pro 


cct act 

WWW >JVV 

pro ala 
601/201 


y ww 

val 


gcc 
ala 


a w w 

thr 


aw w 

thr 


ggc 
gly 


egg 
arg 


gcg 
ala 


cec 
pro 


egg gat 
arg asp 
631/211 


age 
ser 


cgt 
arg 


acg 
thr 


cca 
pro 


etc 
leu 


cga 
arg 


gca 
ala 


ttg 
leu 


aca cot 
ala arg 
661/221 


tgc 
cys 


wwGI 

ser 


rrt* t* 

val 


egg 
arg 


egg 
arg 


ccg 
pro 


a eg 
thr 


gca 
ala 


gcg ccg 
ala pro 
691/231 


tgg 
trp 


tgt 
cys 


egg 
arg 


egg 
arg 


cct 
pro 


egg 
arg 


cct 
pro 


gtt 
val 


caa eta 

w-yy wwy 

arg leu 
721/241 


ccg 
pro 


tta 
leu 


cct 
pro 


wy a 

arg 


egg 
arg 


eey 

pro 


cga 
arg 


ccg 
pro 


cct gcc 
pro ala 
751/251 


age 
ser 


cgc 
arg 


gcc 
ala 


gcc 
ala 


gga 
gly 


tgt 
cys 


get 
ala 


cca 
pro 


gcc aca 
ala thr 
781/261 


tta 
leu 


aoa 
gly 


cgc 
arg 


gca 
ala 


aag 
lys 


tct 
ser 


egg 
arg 


tgc 
cys 


www i_yy 

pro trp 
811/271 


ggt 
gly 


age 
ser 


gca 
ala 


ccg 
ser 


cgt 
arg 


cga 
arg 


cat 
his 


aca 
thr 


ccg tea 
pro ser 
841/281 


ggg 

gly 


cat 
his 


cac 
his 


cga 
arg 


ggc 
gly 


ggc 
gly 


get 
ala 


cca 
pro 


tat cgc 
tyr arg 
871/291 


tgg 
trp 


gcg 
ala 


gca 
ala 


gat 
asp 


cga 
arg 


tga 
OPA 


gga ata 
gly ile 


teg cca 
ser pro 
901/301 


a eg 
thr 


cgc 
arg 


ggt 
gly 


gtc 
val 


etc 
leu 


etc 
leu 


atg 
met 


tga 
OPA 


tga acc 
OPA thr 
931/311 


gat 
asp 


gcg 
ala 


tgc 
cys 


ttg 
leu 


cgc 
arg 


acc 
thr 


agt 
ser 


ate 
ile 


gga caa 
gly gin 
961/321 


gcc 
ala 


gat 
asp 


gag 
glu 


gcc 
ala 


gcc 
ala 


cgc 
arg 


get 
ala 


gga 
gly 


egg ggc 
arg gly 
991/331 


ttg 
leu 


tag 
AMB 


cgt 
arg 


atg 
met 


gcc 
ala 


gtt 
val 


tec 
ser 


get 
ala 


cag etc 
gin leu 


gtc 
val 


get 
ala 


gcg 
ala 


gcg 
ala 


ccg 
pro 


ccg 
pro 


gga tag 
gly AMB 


aat cgc 
asn arg 


ccg 
pro 


cga 
arg 


acc 
thr 


agt 
ser 


ggt 
gly 


acg 
thr 


gcg cag 
ala gin 



SEQ ID N° 45ZB 

FIGURE 45ZB 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



150/185 



1021/341 
att gac etc 
lie asp leu 

1081/361 
tta cgt gac 
leu arg asp 
1141/381 
tgc ttg acc 
cys leu thr 
1201/401 
gtg. gcg ggg 
val ala gly 
1261/421 
tea teg gtc 
ser ser val 
1321/441 
tec cga tac 
ser arg tyr 
1381/461 
ccg gtc etc 
pro val leu 
1441/481 
age gtc gta 
ser val val 



gta tea tct gag 
val ser ser glu 

agt ctg teg gca 
ser leu ser ala 

aga teg aga gcg 
arg ser arg ala 

get tec gcg cac 
ala ser ala his 

tgg gga tgt tgg 
trp gly cys trp 

tea gcg ttt teg 
ser ala phe ser 

ggt tgt ccg gca 
gly cys pro ala 

cca agg ggg ccg 
pro arg gly pro 



tta gtt gee 
leu val ala 

agg agg gac 
arg arg asp 

etc tct acg 
leu ser thr 

cga ccg cgc 
arg pro arg 

ttt ccg gcg 
phe pro ala 

gtt ttg teg 
val leu ser 

gga tgg ate 
gly trp ile 

ggg get cat 
gly ala his 



1051/351 

cgc gca atg ggc 

arg ala met gly 

1111/371 
gca tgc cac tct 
ala cys his ser 
1171/391 
ccg aag ate cca 
pro lys ile pro 
1231/411 
ggc ggc gec tgc 
gly gly ala cys 
1291/431 
tgg cgt tea aag 
trp arg ser lys 
1351/451 
tga tgt teg gtg 
OPA cys ser val 
1411/471 
gtg gcg gat egg 
val ala asp arg 
147 1/4 SI 
tea cca gec gta 
ser pro ala val 



ate cgc gtg tta teg gta 
ile arg val leu ser val 

ccg ate atg age age gga 
pro ile met ser ser gly 

agt teg cat cga gtg tec 
ser ser his arg val ser 

agg gcg egg cgt tgt tea 
arg ala arg arg cys ser 

aga cca tga teg gaa gtt 
arg pro OPA ser glu val 

gtg tgg tgt atg cca tea 
val trp cys met pro ser 

ctg ctg ggg ctt cgc gec 
leu leu gly leu arg ala 

tgg aag ate 
trp lys ile 



SEQ ID N° 452B (suite) 
FIGURE 45ZB (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



151/185 



fragment seq45ZA en decalage moins 2 pour la phase de lecture 



1/1 


















31/11 


















uwu ucc 

ser pro 
61/21 


egg 
arg 


ova 

thr 


W Wa 

pro 


ggt 
gly 


his 


ccg 
pro 


gcg 
ala 


aga 
arg 


tgg tga 
trp OPA 
91/31 


teg 
ser 


agg 
arg 


etc 
leu 


gga 
gly 


ccc 
pro 


gca 
ala 


ggc 

giy 


ate 
ile 


wyy my 

arg AMB 
121/41 


W WCX 

pro 


gag 
glu 


gca 
ala 


cca 
pro 


gca 
ala 


UCd 

ser 


gca 
ala 


aca 
thr 


teg cga 
ser arg 
151/51 


tgg 
trp 


cca 
pro 


gca 
ala 


tgc 
cys 


cgc 
arg 


gee 
ala 


gtc 
val 


ggg 

gly 


ser leu 
181/61 


w wet 

pro 


leu 


gcg 
ala 


a ww 

ile 


Cut 

leu 


99g 
gly 


atg 
met 


a eg 
thr 


gtg ggg 
val gly 
211/71 


cat 
his 


age 
ser 


tag 
AMB 


cgc 
arg 


gca 
ala 


cca 
pro 


ggt 

giy 


cat 
his 


arg ala 
241/81 


aga 
arg 


ccg 
pro 


ggc 
gly 


ci uy 

met 


ccg 
pro 


cgt 
arg 


egg 
arg 


caa 
gin 


get gtc 
ala val 
271/91 


999 
gly 


cgc ggg 
arg gly 


tta 
leu 


gag 
glu 


egg 
arg 


tag 
AMB 


cgt 
arg 


y y aww 

ala thr 
301/101 


cag 
gin 


ya u 

asp 


ggc 
gly 


gaa 
glu 


tgc 
cys 


teg 
ser 


999 
gly 


gec 
val 


acc ggc 
thr gly 
331/111 


gaa 
glu 


gtg gta 
val val 


gee 
ala 


gcg 
ala 


gat 
asp 


gat 
asp 


gtc 
val 


gly glu 
361/121 


gec 
ala 


caa 
gin 


ccg 
pro 


gcg 
ala 


y La 

val 


caa 
gin 


ccg 
pro 


cca 
pro 


cgc ccg 
arg pro 
391/131 


att 
ile 


gtc 
val 


etc 
leu 


acc 
thr 


gtt 
val 


ggt 
gly 


etc 
leu 


egg 
arg 


t"nt" nets* 

y yy 
cys gly 
421/141 


na rr 
gag 

glu 


cag 
gin 


gac 
asp 


grt 
val 


gtc 
val 


etc 
leu 


gtc 
val 


gcg 
ala 


acc ggc 
thr gly 
451/151 


tag 
AMB 


cag teg 
gin ser 


gcg 
ala 


ggc 
gly 


caa 
gin 


cgc 
arg 


etc 
leu 


www y»y 

pro glu 
481/161 


gec 
ala 


a eg 
thr 


gec 
ala 


txg 
leu 


age 
ser 


gcg 
ala 


999 
gly 


aag 
lys 


gat gtg 
asp val 
511/171 


caa 
gin 


ttc agt 
phe ser 


caa 
gin 


etc 
leu 


gaa 
glu 


gta 
val 


get 
ala 


yy u wa l. 

gly his 
541/181 


/•a rr 
Lay 

gin 


teg 
ser 


ggc 
gly 


gai- 
asp 


cgc 
arg 


cag 
AMB 


gcg 
ala 


egg 
arg 


aaa gee 
lys ala 
571/191 


get 
ala 


gcg 
ala 


ttg 
leu 


caa 
gin 


gec 
ala 


cag 
gin 


tac 
tyr 


cac 
his 


eta cfca 
leu leu 
601/201 


tta 

uu y 
leu 


cca 
pro 


cca 
pro 


ctg 
leu 


gec 
ala 


999 
gly 


cgc 
arg 


ccc 
pro 


ggg ata 
gly ile 
631/211 


gec 
ala 


gta 
val 


cgc 
arg 


cac 
his 


tec 
ser 


gag 
glu 


cat 
his 


tgg 
trp 


cac ofcfc 

w* y i» 

arg val 
661/221 


get 
ala 


cag 
gin 


phe 


ggc 
gly 


ggc 
gly 


cga 
arg 


egg 
arg 


cag 
gin 


cgc cgt 
arg arg 
691/231 


ggt 
gly 


gtc ggc 
val gly 


ggc 
gly 


etc 
leu 


ggc 
gly 


ctg 
leu 


ttc 
phe 


aac toe 
yy w w y 

gly cys 
721/241 


cat 
arg 


tac 
tyr 


etc 
leu 


gac 
asp 


aac 
yy w 

gly 


cgc 
arg 


gac 
asp 


wy w 

arg 


ctg cca 
leu pro 
751/251 


gee 
ala 


gcg 
ala 


ccg 
pro 


ccg 
pro 


gat 
asp 


gtg 
val 


etc 
leu 


cag 
gin 


cca cat 
pro his 
781/261 


tgg 
trp 


ggc 
gly 


gcg 
ala 


caa 
gin 


agt 
ser 


etc 
leu 


ggt 

giy 


gee 
ala 


cct ggg 
pro gly 
811/271 


gta 
val 


gcg 
ala 


cat 
his 


cgc 
arg 


gtc 
val 


gac 
asp 


ata 
ile 


cac 
his 


cgt cag 
arg gin 
841/281 


ggc 
gly 


ate 
ile 


acc 
thr 


gag 
glu 


gcg 
ala 


gcg 
ala 


etc 
leu 


cat 
his 


ate get 
ile ala 
871/291 


ggg 

gly 


egg cag 
arg gin 


ate 
ile 


gat 
asp 


gag 
glu 


gaa 
glu 


tat 
tyr 


cgc caa 
arg gin 
901/301 


cgc 
arg 


gcg 
ala 


gtg 
val 


tec 
ser 


tec 
ser 


tea 
ser 


tgt 
cys 


gat 
asp 


gaa ccg 
glu pro 
931/311 


atg 
met 


cgt get 
arg ala 


tgc 
cys 


gca 
ala 


cca 
pro 


gta 
val 


teg 
ser 


gac aag 
asp lys 


ccg 
pro 


atg 
met 


agg 
arg 


ccg 
pro 


ccc 
pro 


gcg 
ala 


ctg 
leu 


gac 
asp 


ggg get 
gly ala 


tgt 
cys 


age 
ser 


gta 
val 


tgg 
trp 


ccg 
pro 


ttt 
phe 


ccg 
pro 


etc 
leu 



SEQ ID N° 45ZC 
FIGURE 45ZC 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



152/185 

961/321 991/331 

age teg teg ctg egg cgc cgc egg gat aga ate gee cgc gaa cca gtg gta egg cgc aga 

ser ser ser leu arg arg arg arg asp arg ile ala arg glu pro val val arg arq ara 
1021/341 1051/351 

ttg acc teg tat cat ctg agt tag ttg ccc gcg caa tgg gca tec gcg tgt tat egg tat 

leu thr ser tyr his leu ser AMB leu pro ala gin trp ala ser ala cys tyr ara tvr 
1081/361 1111/371 7 

tac gtg aca gtc tgt egg caa gga ggg acg cat gee act etc cga tea tga gca gcg gat 

tyr val thr val cys arg gin gly gly thr his ala thr leu arg ser OPA ala ala aso 
1141/381 1171/391 

get tga cca gat cga gag cgc tct eta cgc cga aga tec caa gtt cgc ate gag tgt ccg 

ala OPA pro asp arg glu arg ser leu arg arg arg ser gin val arg ile glu cys pro 
1201/401 1231/411 

tgg egg ggg ctt ccg cgc acc gac cgc gcg gcg gcg cct gca ggg cgc ggc gtt gtt cat 

trp arg gly leu pro arg thr asp arg ala ala ala pro ala gly arg gly val val his 
1261/421 1291/431 

cat egg tct ggg gat gtt ggt ttc egg cgt ggc gtt caa aga gac cat gat egg aag ttt 

his arg ser gly asp val gly phe arg arg gly val gin arg asp his asp arq lys phe 
1321/441 1351/451 

ccc gat act cag cgt ttt egg ttt tgt cgt gat gtt egg tgg tgt ggt gta tgc cat cac 

pro asp thr gin arg phe arg phe cys arg asp val arg trp cys gly val cys his his 
1381/461 1411/471 

egg tec teg gtt gtc egg cag gat gga teg tgg egg ate ggc tgc tgg ggc ttc gcg cca 

arg ser ser val val arg gin asp gly ser trp arg ile gly cys. trp gly phe ala pro 
1441/481 1471/491 

gcg teg tac caa ggg ggc egg ggg etc att cac cag ccg tat gga aga tc 

ala ser tyr gin gly gly arg gly leu ile his gin pro tyr gly arg 

SEQ ID N° 45ZC (suite 1) 
FIGURE 45ZC (suite 1) 



ORF de seq 45ZA 


directement 


en fusion avec phoA 














cag tct gtc 
gin ser val 
1141/381 


ggc 
gly 


aag 
lys 


gag 
glu 


gga 
gly 


cgc 
arg 


atg 
met 


cca 
pro 


etc tec gat 
leu ser asp 
1171/391 


cat 
his 


gag cag 
glu gin 


egg 
arg 








atg ctt gac 
met leu asp 
1201/401 


cag 
gin 


ate 
ile 


gag 
glu 


age 
ser 


get 
ala 


etc 
leu 


tac 
tyr 


gee gaa gat 
ala glu asp 
1231/411 


ccc 
pro 


aag ttc 
lys phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


cgt ggc ggg 
arg gly gly 
1261/421 


ggc 
gly 


ttc 
phe 


cgc 
arg 


gca 
ala 


ccg 
pro 


acc 
thr 


gcg 
ala 


egg egg cgc 
arg arg arg 
1291/431 


ctg 
leu 


cag ggc 
gin gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


ate ate ggt 
ile ile gly 
1321/441 


ctg 
leu 


ggg 

gly 


atg 
met 


ttg 
leu 


gtt 
val 


tec 
ser 


ggc 
gly 


gtg gcg ttc aaa 
val ala phe lys 
1351/451 


gag acc 
glu thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 
ser 


ttc ccg ata 
phe pro ile 
1381/461 


etc 
leu 


age 
ser 


gtt 
val 


ttc 
phe 


ggt 
gly 


ttt 
phe 


gtc 
val 


gtg atg ttc 
val met phe 
1411/471* 


ggt 
gly 


ggt gtg 
gly val 


gtg 

val 


tat 
tyr 


gec 
ala 


ate 
ile 


acc ggt cct 
thr gly pro 
1441/481 


egg 
arg 


ttg 
leu 


tec 
ser 


ggc 
gly 


agg 
arg 


atg 
met 


gat 
asp 


cgt ggc gga 
arg gly gly 
1471/491 


teg 
ser 


get get 
ala ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag cgt cgt 
gin arg arg 


acc 
thr 


aag 
lys 


ggg 

gly 


gec 
ala 


ggg 

gly 


ggc 
gly 


tea 
ser 


ttc acc age 
phe thr ser 


cgt 
arg 


atg gaa 
met glu 


gat 
asp 


c 







SEQ ID N° 45A 
FEUILLE DE REMP^ggE^j^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



153/185 



Sequence Rv2169c predite par Cole et al., 1998 (Nature 393:537-544) et contenant 
Seq45A 

1/1 31/11 

atg cca etc tec gat cat gag cag egg atg ctt gac cag ate gag age get etc tac qcc 

Met pro leu set asp his glu gin arg met leu asp gin lie glu ser ala leu tvr ala 
61/21 91 / 31 y 

gaa gat ccc aag ttc gca teg agt gtc cgt ggc ggg ggc ttc cgc gca ccg acc gcg egg 

glu asp pro lys phe ala ser ser val arg gly gly g i y phe arg a la pro thr ala arg 
121/41 151/51 

egg cgc ctg cag ggc gcg gcg ttg ttc ate ate ggt ctg ggg atg ttg gtt tec ggc gtg 

arg arg leu gin gly ala ala leu phe ile ile gly leu gly met leu val ser gly val 
181/61 211/71 

gcg ttc aaa gag acc atg ate gga agt ttc ccg ata etc age gtt ttc ggt ttt gtc ate 

5« lyS glU thr met ile gly Ser phe pro ile leu ser val P h e gly phe val val 
241/81 271/91 

atg ttc ggt ggt gtg gtg tat gec ate acc ggt cct egg ttg tec ggc ago atg gat cat 

9ly 9ly Val tyr 313 116 thr 9ly pro arg leu ser 9ly arg met asp arg 
301/101 331/111 y 

ggc gga teg get get ggg get teg cgc cag cgt cgt acc aag ggg gec ggg ggc tea ttc 

fi y /?i y S6t 313 9ly 3la S6r arg gln arg ar 9 thr !V S gly ala gly gly ser phe 
361/121 391/131 

acc age cgt atg gaa gat egg ttc egg cgc cgc ttc gac gag taa 

thr ser arg met glu asp arg phe arg arg arg phe asp glu OCH 

SEQ ID N° 45D 



FIGURE 45D 



ORF d'apres 


Cole et 


al. , 


1998 (Nature 393:537-544) et contenant 


Rv2169c 






1/1 


















31/11 


















tga cag 
OPA gin 
61/21 


tct 
ser 


gtc 
val 


ggc 
gly 


aag 
lys 


gag 
glu 


gga 
gly 


cgc 
arg 


atg 
met 


cca etc 
pro leu 
91/31 


tec 
ser 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


atg 
met 


ctt 
leu 


gac cag 
asp gin 
121/41 


ate 
ile 


gag 
glu 


age 
ser 


get 
ala 


etc 
leu 


tac 
tyr 


gee 
ala 


gaa 
glu 


gat ccc 
asp pro 
151/51 


aag 
lys 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


cgt 
arg 


ggc 
gly 


ggg ggc 
gly gly 
181/61 


ttc 
phe 


cgc 
arg 


gca 
ala 


ccg 
pro 


acc 
thr 


gcg 
ala 


egg 
arg 


egg 
arg 


cgc ctg 
arg leu 
211/71 


cag 
gin 


ggc 
gly 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


ate 
ile 


ate 
ile 


ggt ctg 
gly leu 
241/81 


ggg 

gly 


atg 
met 


ttg 
leu 


gtt 
val 


tec 
ser 


ggc 
gly 


gtg 
val 


gcg 
ala 


ttc aaa 
phe lys 
271/91 


gag 
glu 


acc 
thr 


atg 
met 


ate 
ile 


gga 
gly 


agt 

ser 


ttc 
phe 


ccg 
pro 


ata etc 
ile leu 
301/101 


age 
ser 


gtt 
val 


ttc 
phe 


ggt 
gly 


ttt 
phe 


gtc 
val 


gtg 
val 


atg 
met 


ttc ggt 
phe gly 
331/111 


ggt 
gly 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


acc 
thr 


ggt 
gly 


cct egg 
pro arg 
361/121 


ttg 
leu 


tec 
ser 


ggc 
gly 


agg 
arg 


atg 
met 


gat 
asp 


cgt 
arg 


ggc 
gly 


gga teg 
gly ser 
391/131 


get 
ala 


get 

ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


cag 
gin 


cgt 
arg 


cgt acc 
arg thr 
421/141 


aag 
lys 


ggg 

gly 


gee 
ala 


ggg 

gly 


ggc 
gly 


tea 
ser 


ttc 
phe 


acc 
thr 


age cgt 
ser arg 


atg 
met 


gaa 
glu 


gat 
asp 


egg 
arg 


ttc 
phe 


egg 
arg 


cgc 
arg 


cgc 
arg 


ttc gac 


gag 


taa 
































phe asp 


glu 


OCH 

































SEQ ID N° 45F 
FEUILLE DE REMfJ^gEJIE^REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



154/185 



1/1 

cag ccg cgc cgc ate gac cag 

gin pro arg arg ile asp gin 
61/21 

tec ggt gaa cat cgc acc agg 

ser gly glu his arg thr arg 
121/41 

ccg gee aac tea cag aca ccc 

pro ala asn ser gin thr pro 
181/61 

cgt cgc ate gee gtc etc gec 

arg arg ile ala val leu ala 
241/81 

teg ggc teg aag cca age ggc 

ser gly ser lys pro ser gly 
301/101 

acc gcg cag acc aag get etc 

thr ala gin thr lys ala leu 







31/11 




ygc cue 


acg 


ccc ggt 


cac 




enr 


pro gly his 






91/31 




ll3 ggc 


age 


aat ccc 


gcg 


leu gly 


ser 


asn pro 


ala 






151/51 




tct acg 


atg 


cag ggt 


atg 


ser thr 


met 


gin gly met 






211/71 




gee gtt 


age 


ate gee 


gee 


ala val 


ser 


ile ala 


ala 






271/91 




gga cca 


ctt 


ccg gac 


gcg 


gly pro 


leu 


pro asp 


ala 






331/111 




aag age 


gcg 


cac atg 


gtg 


lys ser 


ala 


his met 


val 



SEQ ID N° 46A 
FIGURE 46A 



ttc tec gcg ttc etc aac aat 
phe ser ala phe leu asn asn 

gac ccg cac ccc act cgc cga 
asp pro his pro thr arg arg 

egg acc ccc aga cgc cac tgc 
arg thr pro arg arg his cys 

act gtc gtt gee ggc tgc teg 
thr val val ala gly cys ser 

aag ccg ctg gtc gag gag gec 
lys pro leu val glu glu ala 

ctg acg gtc aac ggc aag ate 
leu thr val asn gly lys ile 



1/1 

age cgc gee gca teg acc agg, 
ser arg ala ala ser thr arg 
61/21 

ccg gtg aac ate gca cca ggt 
pro val asn ile ala pro gly 
121/41 

egg cca act cac aga cac cct 
arg pro thr his arg his pro 
181/61 

gtc gca teg ccg tec teg ccg 
val ala ser pro ser ser pro 
241/81 

c 99 get cga age caa gcg gcg 
arg ala arg ser gin ala ala 
301/101 

ccg cgc aga cca agg etc tea 
pro arg arg pro arg leu ser 









31/11 




gec 


tea 


cgc 


ccg gtc 


act 


ala 


ser 


arg 


pro val 


thr 








91/31 




tag 


gca 


gca 


ate ccg 


egg 


AMB 


ala 


ala 


ile pro 


arg 








151/51 




eta 


cga 


tgc 


agg gta 


tgc 


leu 


arg 


cys 


arg val 


cys 








211/71 




ccg 


tta 


gca 


teg ccg 


cca 


pro 


leu 


ala 


ser pro 


pro 








271/91 




gac 


cac 


ttc 


egg acg 


cga 


asp 


his 


phe 


arg thr 


arg 








331/111 




aga 


gcg 


cgc 


aca tgg 


tgc 


arg 


ala 


arg 


thr trp 


cys 



SEQ ID N° 46B 
FIGURE 46B 



tct ccg cgt tec tea aca att 

ser pro arg ser ser thr ile 

acc cgc acc cca etc gee gac 

thr arg thr pro leu ala asp 

gga ccc cca gac gee act gee 

gly pro pro asp ala thr ala 

ctg teg ttg ccg get get cgt 

leu ser leu pro ala ala arg 

age cgc tgg teg agg agg cca 

ser arg trp ser arg arg pro 

tga egg tea acg gca aga tc 

OPA arg ser thr ala arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



155/185 



i/i 






gcc gcg 


ccg 


cat cga 


ala ala 


pro 


his arg 


61/21 






egg tga 


aca 


teg cac 


arg OPA 


thr 


ser his 


121/41 






ggc caa 


etc 


aca gac 


gly gin 


leu 


thr asp 


181/61 






teg cat 


cgc 


cgt cct 


ser his 


arg 


arg pro 


241/81 






ggg etc 


gaa 


gcc aag 


gly leu 


glu 


ala lys 


301/101 






cgc gca 


gac 


caa ggc 


arg ala 


asp 


gin gly 



cca ggg cct cac gcc 
pro gly pro his ala 

cag gtt agg cag caa 
gin val arg gin gin 

acc etc tac gat gca 
thr leu tyr asp ala 

cgc cgc cgt tag cat 
arg arg arg AMB his 

egg egg acc act tec 
arg arg thr thr ser 

tct caa gag cgc gca 
ser gin glu arg ala 



31/11 

egg tea ctt etc cgc 
arg ser leu leu arg 
91/31 

tec cgc gga ccc gca 
ser arg gly pro ala 
151/51 

ggg tat gcg gac ccc 
gly tyr ala asp pro 
211/71 

cgc cgc cac tgt cgt 
arg arg his cys arg 
271/91 

gga cgc gaa gcc get 
gly arg glu ala ala 
331/111 

cat ggt get gac ggt 
his gly ala asp gly 



gtt cct caa caa ttc 
val pro gin gin phe 

ccc cac teg ccg acc 
pro his ser pro thr 

cag acg cca ctg ccg 
gin thr pro leu pro 

tgc egg ctg etc gtc 
cys arg leu leu val 

ggt cga gga ggc cac 
gly arg gly gly his 

caa egg caa gat c 
gin arg gin asp 



SEQ ID N° 46C 
FIGURE 46C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



156/185 



Sequence codante Rvl411c predite par Cole et al., 1998 (Nature 393: 537-544) et 
contenant seq46A: ' 

1/1 31/11 

c ate gcc 
g ile ala 

91/31 
c teg aag 
/ ser lys 

151/51 
g cag acc 
a gin thr 

211/71 
a ctg tct 
/ leu ser 

271/91 
z gtc aag 

1 val lys 
331/111 

; ctg tac 
5 leu tyr 
391/131 

2 gac ccc 
c asp pro 

451/151 
: gac gca 
i asp ala 
. 511/171 
I aag gta 
f lys val 
571/191 
J ccg gcg 
L pro ala 
631/211 
: cgc ggc 
) arg gly 
691/231 



atg egg 
Met arg 
61/21 


acc 
thr 


ccc 
pro 


aga 
arg 


cgc 
arg 


cac 
his 


tgc 
cys 


cgt 
arg 


gcc act 
ala thr 
121/41 


gtc 
val 


gtt 
val 


gcc 
ala 


ggc 
gly 


tgc 
cys 


teg 
ser 


teg 
ser 


gcg aag 
ala lys 
181/61 


ccg 
pro 


ctg 
leu 


gtc 
val 


gag 
glu 


gag 
glu 


gcc 
ala 


acc 
thr 


gtg ctg 
val leu 
241/81 


a eg 
thr 


gtc 
val 


aac 
asn 


ggc 
gly 


aag 
lys 


ate 
ile 


ccg 
pro 


acc acc 
thr thr 
301/101 


aac 
asn 


ccc 
pro 


acc 
thr 


gcc 
ala 


gcg 
ala 


acg 
thr 


gga 
gly 


gat gcc 
asp ala 
361/121 


gac 
asp 


ttc 
phe 


gtg 
val 


gtg 
val 


ttc 
phe 


gac 
asp 


ggg 

gly 


age gat 
ser asp 
421/141 


ttc 
phe 


ggt 
gly 


ccc 
pro 


gcc 
ala 


gcc 
ala 


gac 
asp 


ate 
ile 


ggc ctg 
gly leu 
481/161 


gcc 
ala 


aac 
asn 


gtg 
val 


ctg 
leu 


gcg 
ala 


aat 
asn 


ttc 
phe 


aac ggc 
asn gly 
541/181 


cag 
gin 


aac 
asn 


acc 
thr 


ate 
ile 


cgc 
arg 


ate 
ile 


age 
ser 


gcg ccg 
ala pro 
601/201 


ccg 
pro 


ttc 
phe 


aac 
asn 


gcg 
ala 


acg 
thr 


cag 
gin 


ccg 
pro 


gat cat 
asp his 
661/221 


caa 
gin 


ctg 
leu 


gca 
ala 


cag 
gin 


gcc 
ala 


cag 
gin 


ttg 
leu 


ttg teg 
leu ser 


aaa 
lys 


tgg 
trp 


ggc 
gly 


gag 
glu 


aag 
lys 


gtc 
val 


cag 
gin 



gtc 
val 


etc 
leu 


gcc 
ala 


gcc gtt 
ala val 


age 
ser 


ate 
ile 


gcc 
ala 


cca 
pro 


age 
ser 


ggc 
gly 


gga cca 
gly pro 


ctt 
leu 


ccg 
pro 


gac 
asp 


aag 
lys 


get 
ala 


etc 
leu 


aag age 
lys ser 


gcg 
ala 


cac 
his 


atg 
met 


ctg 
leu 


aag 
lys 


acg 
thr 


ctg age 
leu ser 


ggc 
gly 


gat 
asp 


etc 
leu 


etc 
leu 


acg 
thr 


ctg 
leu 


ggt ggg 
gly gly 


tct 
ser 


gat 
asp 


ate 
ile 


gcc 
ala 


acc 
thr 


ctg 
leu 


acg ccc 
thr pro 


aac 
asn 


cag 
gin 


tgg 
trp 


gcc 

aid 


cag 
g±n 


gtg 

... i 
vax 


ctg aat 
leu asn 


ccg 
pro 


gat 
asp 


acc 
thr 


aaa 
lys 


gcc 
ala 


gaa 
glu 


ggg egg 
gly arg 


gat 
asp 


acc 
thr 


ate 
ile 


teg 
ser 


gca 
ala 


cag 
gin 


gcg gtg 
ala val 


aac 
asn 


cag 
gin 


ata 
ile 


acc 
thr 


gtc 
val 


tgg 
trp 


att cag 
ile gin 


gag 
glu 


acc 
thr 


ggc 
gly 


teg 
ser 


ggc 
gly 


aat 
asn 


tec gtc 
ser val 


cag 
gin 


atg 
met 


acc 
thr 


ccc 
pro 


ccg 
pro 


gtg 
val 


age tga 
ser OPA 









SEQ ID N° 46D 
FIGURE 46D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



157/185 

ORF d'apres par Cole et al., 1998 (Nature 393: 537-544) 
et contenant la sequence codante Rvl411c: 



1/1 

Xf X 








acc 


cag 


AMR 1 pu 


thr 


y xxi 


01/ d. 1 






gtc ggg 


l»clcl 


ta c 


ua 1 rr 1 t/ 
VQi \jiy 


gin 


tyr 


1^ X/ n X 






y *— y y c 


fit" 0 
y 


ggc 


cijlo yxy 


va J. 


gly 


101/ 01 






etc accr 


CCC 


ggt 


leu thr 


pro 


yxy 


941 /fl1 

^ H 1/ O X 






yyi* ayu 


aat 


CCC 


gly ser 


asn 


JJi u 


Qfti /i m 

jUi/ 1U1 






ci i~ y a y 


y 


ggt 


UilX UlC l> 


y xii 


gly 


JOl/ 1^1 






gtt age 


ate 


gcc 


val ser 


ile 


ala 


401 /I 41 






CCct cut. 


ccg 


gac 


pro leu 


pro 


asp 


491/161 






ayi» y y 


cac 


atg 


ser ala 


his 


met 


S4 1 /I fll 

J*i X/ XQ X 






ay t» y y v» 


gat 


etc 


ser gly 


asp leu 


601/201 

X/ £, V X 






rtrtrt tf"t 

yyy uuu 


gat ate 


gly ser 


asp 


ile 


DDI/ 






ccc aac 


cag 


tgg 


pro asn 


gin trp 


721/241 






aat ceo 


gat 


acc 


asn pro 


asp 


thr 


781/261 






egg gat 


acc 


ate 


arg asp 


thr 


ile 


841/281 






gtg aac 


cag 


ata 


val asn 


gin ile 


901/301 






cag gag 


acc 


ggc 


gin glu 


thr gly 


961/321 






gtc cag 


atg 


acc 


val gin 


met 


thr 


1021/341 




tga 






OPA 







gtt gga ccg gtt 
val gly pro val 

ate gac gac cgt 
ile asp asp arg 

ggt aac cat egg 
gly asn his arg 

cac ttc tec gcg 
his phe ser ala 

gcg gac ccg cac 
ala asp pro his 

atg egg acc ccc 
met arg thr pro 

gcc act gtc gtt 
ala thr val val 

gcg aag ccg ctg 
ala lys pro leu 

gtg ctg acg gtc 
val leu thr val 

acc acc aac ccc 
thr thr asn pro 

gat gcc gac ttc 
asp ala asp phe 

age gat ttc ggt 
ser asp phe gly 

ggc ctg gcc aac 
gly leu ala asn 

aac ggc cag aac 
asn gly gin asn 

gcg ccg ccg ttc 
ala pro pro phe 

gat cat caa ctg 
asp his gin leu 

ttg teg aaa tgg 
leu ser lys trp 







31/11 


cag 


tgt 


etc ggc 


gin 


cys 


leu gly 






91/31 


cag 


aca 


cac gcc 


gin 




nis ala 






1 C 1 /CI 

151/51 


acc 


gcg 


gat ggt 


tnr 


ala 


asp gly 






211/71 


ttc 


etc 


aac aat 


pne 


leu 


asn asn 






271/91 


ccc 


act 


cgc cga 


pro 


thr 


arg arg 






331/111 


aga 


cgc 


cac tgc 


arg 


arg 


his cys 






391/131 


gcc 


ggc 


tgc teg 


ala 


gly 


cys ser 






451/151 


gtc 


gag 


gag gcc 


...1 
val 


glu 


glu ala 






511/171 


aac 


ggc 


aag ate 


asn 


gly 


lys ile 




• 


571/191 


acc 


gcc 


gcg acg 


thr 


ala 


ala thr 






631/211 


gtg 


gtg 


ttc gac 


val 


val 


phe asp 






691/231 


ccc 


gcc 


gcc gac 


pro 


aia 


ala asp 






751/251 


gtg 


ctg 


gcg aat 


Val 


leu 


ala asn 






pi i / *>i 1 
011/ ^ /i 


acc 


ate 


cgc ate 


thr 


ile 


arg ile 






871/291 


aac 


gcg 


acg cag 


asn 


ala 


thr gin 






931/311 


gca 


cag 


gcc cag 


ala 


gin 


ala gin 






991/331 


ggc 


gag 


aag gtc 


gly 


glu 


lys val 



cat cac gtc ggc 
his his val gly 

gtt gac age gat 
val asp ser asp 

cag ccg cgc cgc 
gin pro arg arg 

tec ggt gaa cat 
ser gly glu his 

ccg gcc aac tea 
pro ala asn ser 

cgt cgc ate gcc 
arg arg ile ala 

teg ggc teg aag 
ser gly ser lys 

acc gcg cag acc 
thr ala gin thr 

ccg gga ctg tct 
pro gly leu ser 

gga aac gtc aag 
gly asn val lys 

ggg ate ctg tac 
gly ile leu tyr 

ate tac gac ccc 
ile tyr asp pro 

ttc gcc gac gca 
phe ala asp ala 

age ggg aag gta 
ser gly lys val 

ccg gtg ccg gcg 
pro val pro ala 

ttg gac cgc ggc 
leu asp arg gly 

cag gtc acg aag 
gin val thr lys 



ggt gaa 
gly glu 


ttg 
leu 


gcc 

axes 


cga 
arg 


gtc 
val 


gcc 
ala 


gtg 

VOX 


ate 
ile 


gac 
asp 


cag 
gin 


ggc 
gxy 


cgc 
arg 


acc 
thr 


agg 
arg 


tta 

leu 

xcu 


cag aca 
gin thr 


ccc 


tct 
ser 


gtc 
val 


etc 
leu 


gcc 
ala 


gcc 

aid 


cca 
pro 


age 
ser 


ggc 

nit* 

giy 


gga 
gly 


aag get 
lys ala 


etc 
leu 


aag 

1 XT Q 

xys 


ctg aag 
leu lys 


acg 
thr 


ctg 
leu 


etc 
leu 


acg 
thr 


ctg 
leu 


ggt 
giy 


gcc 
ala 


acc 
thr 


ctg 
leu 


acg 
thr 


gcc cag 
ala gin 


gtg 
val 


ctg 
leu 


aaa gcc 
lys ala 


gaa 
glu 


ggg 

gly 


teg gca 
ser ala 


cag 
gin 


gcg 
ala 


acc 
thr 


gtc 
val 


tgg 
trp 


att 
ile 


teg 
ser 


ggc 
gly 


aat 
asn 


tec 
ser 


ccc 
pro 


ccg 
pro 


gtg 
val 


age 
ser 



SEQ ID N° 46F 



FEUILLE DE REMRUKBH«EN7*REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



158/185 



1/1 31/11 

gag ctg gtc aac ggc gcc ggc ate gac gac gcc gcc gtc gtg acc tgc egg ccg gac age 

glu leu val asn gly ala gly ile asp asp ala ala val val thr cys arg pro asp ser 

61/21 91/31 

ctg gcc gat gcc cag cag atg gtc gag gcg gca ctg ggc cga tat ggc cgt ttg gac gga 

leu ala asp ala gin gin met val glu ala ala leu gly arg tyr gly arg leu asp qly 

121/41 151/51 

gtg ttg gtg gcc teg ggc age aac cat gtg gcg ccc att acc gag atg gcc gtc gag gac 

val leu val ala ser gly ser asn his val ala pro ile thr glu met ala val glu aso 

181/61 211/71 ¥ 

ttc gac get gtg atg gac gcg aac gtg egg ggt gcc tgg ctg gtg tgt egg gcg gcc gga 

phe asp ala val met asp ala asn val arg gly ala trp leu val cys arg ala ala qlv 

241/81 271/91 

egg gtg ctg etc gag cag ggt cag ggc ggc age gtg gtg ctg gtg teg tec gtt cgc ggc 

arg val leu leu glu gin gly gin gly gly ser val val leu val ser ser val arq qlv 

301/101 331/111 

ggg ttg ggc aat gcc gcc ggt tac age gcg tac tgc ccg teg aag gcg ggc acc gat c 

gly leu gly asn ala ala gly tyr ser ala tyr cys pro ser lys ala gly thr asp 



SEQ ID N° 47A 
FIGURE 47A 



1/1 

age tgg tea acg gcg ccg gca 
ser trp ser .thr ala pro ala 
61/21 

tgg ccg atg ccc age aga tgg 
trp pro met pro ser arg trp 
121/41 

tgt tgg tgg cct egg gca gca 
cys trp trp pro arg ala ala 
181/61 

teg acg ctg tga tgg acg cga 
ser thr leu OPA trp thr arg 
241/81 

ggg tgc tgc teg age agg gtc 
gly cys cys ser ser arg val 
301/101 

ggt tgg gca atg ccg ccg gtt 
gly trp ala met pro pro val 









31/11 




teg 


acg 


acg 


ccg ccg 


teg 


ser 


thr 


thr 


pro pro 


ser 








91/31 




teg 


agg 


egg 


cac tgg 


gcc 


ser 


arg 


arg 


his trp 


ala 








151/51^ 




acc 


atg 


tgg 


cgc cca 


tta 


thr 


met 


trp 


arg pro 


leu 








211/71 




acg 


tgc 


ggg 


gtg cct 


ggc 


thr 


cys 


gly 


val pro 


gly 








271/91 




agg 


gcg 


gca 


gcg tgg 


tgc 


arg 


ala 


ala 


ala trp 


cys 








331/111 




aca 


gcg 


cgt 


act gcc 


cgt 


thr 


ala 


arg 


thr ala 


arg 



SEQ ID N° 47B 
FIGURE 47B 



tga 
OPA 


cct 
pro 


gcc 
ala 


ggc 
gly 


egg 
arg 


aca 
thr 


gcc 
ala 


gat 
asp 


atg 
met 


gcc 
ala 


gtt 
val 


tgg 
trp 


acg 
thr 


gag 
glu 


ccg 
pro 


aga 
arg 


tgg 
trp 


ccg 
pro 


teg 
ser 


agg 
arg 


act 
thr 


tgg 
trp 


tgt 
cys 


gtc 
val 


ggg 

gly 


egg 
arg 


ccg 
pro 


gac 
asp 


tgg 
trp 


tgt 
cys 


cgt 
arg 


ccg 
pro 


ttc 
phe 


gcg 
ala 


gcg 
ala 


cga 
arg 


agg 
arg 


egg 
arg 


gca 
ala 


ccg 
pro 


ate 
ile 





FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



159/185 



1/1 

get ggt caa egg cgc egg cat 
ala gly gin arg arg arg his 
61/21 

ggc cga tgc cca gca gat ggt 
gly arg cys pro ala asp gly 
121/41 

gtt ggt ggc etc ggg cag caa 
val gly gly leu gly gin gin 
181/61 

cga cgc tgt gat gga cgc gaa 
arg arg cys asp gly arg glu 
241/81 

ggt get get cga gca ggg tea 
gly ala ala arg ala gly ser 
301/101 

gtt ggg caa tgc cgc egg tta 
val gly gin cys arg arg leu 



31/11 

cga cga cgc cgc cgt cgt 
arg arg arg arg arg arg 
91/31 

cga ggc ggc act ggg ccg 
arg gly gly thr gly pro 
151/51 

cca tgt ggc gee cat tac 
pro cys gly ala his tyr 

211/71 
cgt gcg ggg tgc ctg get 
arg ala gly cys leu ala 

271/91 
ggg egg cag cgt ggt get 
gly arg gin arg gly ala 

331/111 
cag cgc gta ctg ccc gtc 
gin arg val leu pro val 



SEQ ID N° 47C 
FIGURE 47C 



gac ctg ccg gec 
asp leu pro ala 


craa 
gly 


cag 
gin 


cct 
pro 


ata tgg ccg ttt 
ile trp pro phe 


gga 
gly 


egg 
arg 


agt 
ser 


cga gat ggc cgt 
arg asp gly arg 


cga 
arg 


gga 
gly 


ctt 
leu 


ggt gtg teg ggc 
gly val ser gly 


ggc 
gly 


egg 
arg 


acg 
thr 


ggt gtc gtc cgt 
gly val val arg 


teg 
ser 


egg 
arg 


egg 
arg 


gaa ggc ggg cac 
glu gly gly his 


cga 
arg 


tc 





FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



160/185 



Sequence codante Rvl714 predite par Cole et al., 1998 (Nature 393: 537-544) 
contenant seq 47A: 



1/1 






qtq qag 


gaa 


atq 


val glu 


glu 


met 


61/21 






cag gac 


aag 


tcq 


gin asp 


lys 


ser 


121/41 






gcg ctg 


gcc 


qac 


ala leu 


ala 


asp 


181/61 






gag ctg 


gtc 


aac 


glu leu 


val 


asn 


241/81 






ctg gcc 


qat 


qcc 


leu ala 


asp 


ala 


301/101 






gtg ttg 


gtg 


gcc 


val leu 


val 


ala 


361/121 






ttc gac 


get 


gtg 


phe asp 


ala 


val 


421/141 






egg gtg 


ctg 


etc 


arg val 


leu 


leu 


481/161 






ggg ttg 


ggc 


aat 


gly leu 


gly 


asn 


541/181 






ttg gcc 


aag 


aca 


leu ala 


lys 


thr 


601/201 






ccg acg 


gtg 


ttt 


pro thr 


val 


phe 


661/221 






gcc acc 


egg 


gag 


ala thr 


arg 


glu 


721/241 






ttc gtc 


ggc 


gcc 


phe val 


gly 


ala 


781/261 






atg tat 


ctg 


gac 


met tyr 


leu 


asp 



gcg ctg get cag 
ala leu ala gin 

ate ctg ate acc 
ile leu ile thr 

gcg gga gcg egg 
ala gly ala arg 

ggc gcc ggc ate 
gly ala gly ile 

cag cag atg gtc 
gin gin met val 

teg ggc age aac 
ser gly ser asn 

atg gac gcg aac 
met asp ala asn 

gag cag ggt cag 
glu gin gly gin 

gcc gcc ggt tac 
ala ala gly tyr 

ttg gcg gcc gaa 
leu ala ala glu 

egg tec gcg gtg 
arg ser ala val 

gcg atg etc gcc 
ala met leu ala 

ctg ate tat ctg 
leu ile tyr leu 

ggc ggg tac acc 
gly gly tyr thr 







•31/ XI 


cag 


y t.g 


ccg aac 


aln 


val 


piv don 






y±/ OA 


acre 

yy- 


ClCfl 

y^-y 


uuu y y l> 


alv 

y 


ala 


thr nil/ 
wit yj.y 






101/ Ol 


ctg 


aca 




leu 


thr 


leu ala 






91 1 /ii 

£.±1/ 1 1 


na «** 
y ac 


gac 


gcc gcc 


asp 


asp 


ala ala 
aid ala 






3"71 /Q1 


gag 


gcg 


gca ctg 


glu 


axel 


ala leu 






JOl/ ± -LA 


cat 


gtg 


yc-y ccc 


his 


val 

Vox 


ala pro 








y ^y 


egg 


yyu gcc 


val 


arg 


yiy aid 








aac 

y y *- 


yyc 




yxy 


et Tti 

y^y 


ser val 






Jll/ X / X 


age 


ycy 


tat uyt. 


ser 


ala 








571/191 


tgg 


ggc 


ggt cac 


trp 


gly 


gly his 






631/211 


acc 


gag 


tgg atg 


thr 


glu 


trp met 






691/231 


egg 


ate 


ccg ttg 


arg 


ile 


pro leu 






751/251 


etc 


age 


gac gcc 


leu 


ser 


asp ala 






811/271 


gca 


tgc 


tga 


ala 


cys 


OPA 



ctg 
leu 


ggt 
gly 


ctg 
leu 


gcg 
ala 


teg 
ser 


ttg 
leu 


ggc 
gly 


cga 
arg 


ggc 
gly 


ggc 
gly 


aac 
asn 


teg 
ser 


gtc 
val 


gtg 
val 


acc 
thr 


tgc 
cys 


ggc 
gly 


cga 
arg 


tat 
tyr 


ggc 
gly 


att 
ile 


acc 
thr 


gag 
glu 


atg 
met 


tgg 
trp 


ctg 
leu 


gtg 
val 


tgt 
cys 


gtg 

va 1 
Val 


ctg 
leu 


gtg 
vai 


teg 
ser 


ccg 
pro 


teg 
ser 


aag 
lys 


gcg 
ala 


ggc 
gly 


att 
ile 


egg 
arg 


gtg 
val 


ttc 
phe 


acc 
thr 


gac 
asp 


gat 
asp 


cgc 
arg 


cgc 
arg 


ttc 
phe 


gcc 
ala 


teg 
ser 


age 
ser 


ttc 
phe 


tac 
tyr 



cgc ttc age gtg 
arg phe ser val 

gtt gcc gcc egg 
val ala ala arg 

gcc ggt ctg gcc 
ala gly leu ala 

egg ccg gac age 
arg pro asp ser 

cgt ttg gac gga 
arg leu asp gly 

gcc gtc gag gac 
ala val glu asp 

egg gcg gcc gga 
arg ala ala gly 

tec gtt cgc ggc 
ser val arg gly 

ggc acc gat ctg 
gly thr asp leu 

aac gcg ctg gcg 
asn ala leu ala 

ccg aag ggc egg 
pro lys gly arg 

gaa ccg gaa gac 
glu pro glu asp 

acc ggc cag gtg 
thr gly gin val 



SEQ ID N° 47D 
FIGURE 47D 



FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



161/185 



ORF d'apres Cole et al., 1998 (Nature 393: 537-544) et contenant la sequence 
codante Rvl714: 



24/1 








fart rt^n 
uay y uy 

AMB val 
84/21 


gag 
glu 


na a 
y ad 

glu 


at-rr 

acg 
met 


rit« r^arr 
y *»y ^ci y 

val gin 
144/41 


gac 
asp 


A a rr 
aag 

lys 


teg 
ser 


rna ne*a 
egg gcg 

arg ala 

204/61 


\~ uy 

leu 


gee 

ala 


gac 
asp 


ala glu 
264/81 


ctg 
leu 


gtc 
val 


aa c 
asn 


ser leu 
324/101 


ala 


gaC 

asp 


gcc 
ala 


yya yeg 
gly val 
384/121 


ttrr 
i« uy 

leu 


gtg 
val 


gcc 
ala 


asp phe 
444/141 


gac 
asp 


y e l. 

ala 


gtg 
val 


rrrra. can 
yya egg 

gly arg 
504/161 


gcg 
val 


ctg 
leu 


etc 
leu 


one aaa 
yye ggg 

gly gly 

564/181 


ccg 
leu 


ggc 
gly 


aac 
asn 


ctg ttg 
leu leu 
624/201 


gcc 
ala 


aag 
lys 


aca 
thr 


gcg ccg 
ala pro 
684/221 


a eg 
thr 


gtg 
val 


ttt 
phe 


egg gcc 
arg ala 
744/241 


acc 
thr 


egg 
arg 


gag 
glu 


gac ttc 
asp phe 
804/261 


gtc 
val 


ggc 
gly 


gcc 
ala 


gtg atg 
val met 


tat 
tyr 


ctg 
leu 


gac 
asp 



gcg ctg get cag cag 
ala leu ala gin gin 

ate ctg ate acc ggc 
ile leu ile thr gly 

gcg gga gcg egg ctg 
ala gly ala arg leu 

ggc gcc ggc ate gac 
gly ala gly ile asp 

cag cag atg gtc gag 
gin gin met val glu 

teg ggc age aac cat 
ser gly ser asn his 

atg gac gcg aac gtg 
met asp ala asn val 

gag cag ggt cag ggc 
glu gin gly gin gly 

gcc gcc ggt tac age 
ala ala gly tyr ser 

ttg gcg gcc gaa tgg 
leu ala ala glu trp 

egg tec gcg gtg acc 
arg ser ala val thr 

gcg atg etc gcc egg 
ala met leu ala arg 

ctg ate tat ctg etc 
leu ile tyr leu leu 

ggc ggg tac acc gca 
gly gly tyr thr ala 



54/11 








gtg ccg 
val pro 
114/31 


aac 
asn 


ctg 
leu 


ggt 
gly 


gcg acc 
ala thr 
174/51 


ggt 
gly 


teg 
ser 


ttg 
leu 


aca ctg 
thr leu 
234/71 


gcc 
ala 


ggc 

gly 


ggc 

giy 


gac gcc 
asp ala 
294/91 


gcc 
ala 


gtc 
val 


gtg 
val 


gcg gca 
ala ala 
354/111 


ctg 
leu 


ggc 

giy 


cga 
arg 


gtg gcg 
val ala 
414/131 


ccc 
pro 


att 
ile 


acc 
thr 


egg ggt 
arg gly 
474/151 


gcc 
ala 


tgg 
trp 


ctg 
leu 


ggc age 
gly ser 
534/171 


gtg 
val 


gtg 
val 


ctg 
leu 


gcg tac 
ala tyr 

^ Q A / I Q1 


tgc 
cys 


ccg 
pro 


teg 
ser 


ggc ggt 
gly gly 
654/211 


cac 
his 


ggc 
gly 


att 
ile 


gag tgg 
glu trp 
714/231 


atg 
met 


ttc 
phe 


acc 
thr 


ate ccg 
ile pro 
774/251 


ttg 
leu 


cgc 
arg 


cgc 
arg 


age gac 
ser asp 
834/271 


gcc 
ala 


teg 
ser 


age 
ser 


tgc tga 
cys OPA 









ctg 
leu 


gcg 
ala 


cgc 
arg 


ttc 


age 
ser 


ggc 
qIv 


cga 
ara 

a j-y 


gtt 
val 


gcc 
ala 


gcc 

aid 


aac 
asn 


teg 
ser 


gcc 
ala 


ggt 

yxy 


ctg 

1 f=0 1 


acc 
thr 


tgc 
cvs 


egg 
arg 


ccg 
pro 


gac 
asp 


tat 
tvr 


ggc 
al v 


cgt 
a rg 


ttg 
leu 


gac 
asp 


gag 
glu 


atg 
met 


gcc 
ala 


gtc 
val 


gag 
glu 


gtg 
val 


tgt 
cvs 


egg 
arg 


gcg 
ala 


gcc 

aid 


gtg 
val 


teg 
ser 


tec 
ser 


gtt 

val 


cgc 
arg 


aag 
lys 


gcg 
ala 


ggc 

giy 


acc 
thr 


gat 
asp 


egg 
arg 


gtg 
val 


aac 
asn 


gcg 
ala 


ctg 
leu 


gac 
asp 


gat 
asp 


ccg 
pro 


aag 
lys 


ggc 
gly 


ttc 
phe 


gcc 
ala 


gaa 
glu 


ccg 
pro 


gaa 
glu 


ttc 
phe 


tac 
tyr 


acc 
thr 


ggc 
gly 


cag 
gin 



SEQ ID N° 47F 
FIGURE 47F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



162/185 



1/1 31/11 

agg etc atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg ace ace gee 

arg leu met ser lys thr val leu ile leu gly ala gly val gly gly leu thr thr ala 

61/21 91/31 

gac acc etc cgt caa ctg eta cca cct gag gat c 

asp thr leu arg gin leu leu pro pro glu asp 



SEQ ID N° 48A 
FIGURE 48A 



1/1 31/11 

ggc tea tga gca aga egg ttc tea tec ttg gcg egg gtg teg gcg gee tga cca ccg ccg 

gly ser OPA ala arg arg phe ser ser leu ala arg val ser ala ala OPA pro pro pro 
61/21 91/31 * 

aca ccc tec gtc aac tgc tac cac ctg agg ate 

thr pro ser val asn cys tyr his leu arg ile 



SEQ ID N° 48B 
FIGURE 48B 



1/1 31/11 

get cat gag caa gac ggt tct cat cct tgg cgc ggg tgt egg egg cct gac cac cgc cga 

ala his glu gin asp gly ser his pro trp arg gly cys arg arg pro asp his arg arg 
61/21 

cac cct ccg tea act get acc acc tga gga tc 

his pro pro ser thr ala thr thr OPA gly 



SEQ ID N 9 48C 
FIGURE 48C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



163/185 

Sequence codante Rv0331 predite par Cole et al., 1998 (Nature 393: 537-544) et contenant 
seq48A: 

1/1 31/11 

atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg ace acc gcc gac ace 
Met ser lys thr val leu ile leu gly ala gly val gly gly leu thr thr ala asp thr 
61/21 91/31 

etc cgt caa ctg eta cca cct gag gat cga ate ata ttg gtg gac agg age ttt gac ggg 
leu arg gin leu leu pro pro glu asp arg ile ile leu val asp arg ser phe asp gly 
121/41 151/51 

acg ctg ggc ttg teg ttg eta tgg gtg ttg egg ggc tgg egg egg cct gac gac gtc cgc 
thr leu gly leu ser leu leu trp val leu arg gly trp arg arg pro asp asp val arg 
181/61 211/71 

gtc cgc ccc acc gcg gcg teg ctg ccc ggt gtg gaa atg gtt act gca acc gtc gcc cac 
val arg pro thr ala ala ser leu pro gly val glu met val thr ala thr val ala his 
241/81 271/91 

att gac ate gcg gcc cag gta gtg cac acc gac aac age gtc ate ggc tat gac gcg ttg 
ile asp ile ala ala gin val val his thr asp asn ser val ile gly tyr asp ala leu 
301/101 331/111 

gtg ate gca tta ggt gcg gcg ctg aac acc gac gcc gtt ccc gga ctg teg gac gcg etc 
val ile ala leu gly ala ala leu asn thr asp ala val pro gly leu ser asp ala leu 
361/121 391/131 

gac gcc gac gtc gcg ggc cag ttc tac acc ctg gac ggc gcg get gag ctg cgt gcg aag 
asp ala asp val ala gly gin phe tyr thr leu asp gly ala ala glu leu arg ala lys 
421/141 451/151 * 

gtc gag gcg etc gag cat ggc egg ate get gtg get ate gcc ggg gtg ccg ttc aaa tgc 
val glu ala leu glu his gly arg ile ala val ala ile ala gly val pro phe lys cys 
481/161 511/171 

cca gcc gca ccg ttc gaa gcg gcg ttt ctg ate gcc gcc caa etc ggt gac cgc tac gcc 
pro ala ala pro phe glu ala ala phe leu ile ala ala gin leu gly asp arg tvr ala 
541/181 571/191 Y 

acc gga acc gta cag ate gac acg ttc acg cct gac ccg ctg ccg atg ccc gtt gca ggt 
thr gly thr val gin ile asp thr phe thr pro asp pro leu pro met pro val ala olv 
601/201 631/211 

ccc gag gtc ggc gag get ttg gtc teg atg etc aag gat cac ggt gtc ggc ttc cat cct 
pro glu val gly glu ala leu val ser met leu lys asp his gly val gly phe his pro 
661/221 691/231 

cgc aag gcc eta get cgc gtc gat gag gcc gca agg acg atg cac ttc ggt gac ggc acg 
arg lys ala leu ala arg val asp glu ala ala arg thr met his phe gly asp qly thr 
721/241 751/251 

tec gaa ccg ttc gat ctg ctt gcc gtg gtc ccc ccg cac gtg ccc tec gcc gcg gcg egg 
ser glu pro phe asp leu leu ala val val pro pro his val pro ser ala ala ala ara 
781/261 811/271 * 

tea gcg ggt etc age gaa tec ggg tgg ata ccc gtg gac ccg cgc acc ctg tec act age 
ser ala gly leu ser glu ser gly trp ile pro val asp pro arg thr leu ser thr ser 
841/281 871/291 

gcc gac aac gtg tgg gcc ate ggc gat gcg acc gtg ctg acg ctg ccg aat ggc aaa ccg 
ala asp asn val trp ala ile gly asp ala thr val leu thr leu pro asn gly lys pro 
901/301 931/311 

ctg ccc aag get gcc gtg ttc gcc gaa gcc cag gcc gca gtt gtc gcc cac ggc gtc gcc 
leu pro lys ala ala val phe ala glu ala gin ala ala val val ala his gly val ala 
961/321 991/331 

cgc cat etc ggt tac gac gta get gag cgc cac ttc acc ggc acg ggc gcc tgc tac gtc 
arg his leu gly tyr asp val ala glu arg his phe thr gly thr gly ala cys tvr val 
1021/341 1051/351 

gag acc ggt gat cac cag gca gcc aag ggc gac ggc gat ttc ttc get ccg teg gcg ccc 
glu thr gly asp his gin ala ala lys gly asp gly asp phe phe ala pro ser ala pro 
1081/361 1111/371 

teg gtg acg ctg tac ccg ccg teg egg gag ttt cac gag gag aag gtc gca caa gaa ctg 
ser val thr leu tyr pro pro ser arg glu phe his glu glu lys val ala gin glu leu 
1141/381 

gcc tgg ctg acc cgc tgg aag acg tga 
ala trp leu thr arg trp lys thr OPA. 

SEQ ID N° 48D 



FEUILLE DE REM^gpjfJREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



164/185 



ORF d'apres Cole et al., 1998 (Nature 
codante Rv0331: 



1/1 














tga aca 
OPA thr 
61/21 


ccc 
pro 


gcg 
ala 


ccg 
pro 


acg 
thr 


cqq 
arg 


cga caa teg 
arg gin ser 


cca tgg 
pro trp 
121/41 


gcc 
ala 


gat 
asp 


aat 
asn 


agt 
ser 


ttg 
leu 


act gac teg 
thr asp ser 


gcg gcg 
ala ala 
181/61 


gaa 
glu 


tct 
ser 


aat 
asn 


att 
ile 


cca 
pro 


aag ata tat 
lys ile tyr 


age aag 
ser lys 
241/81 


acg 
thr 


gtt 
val 


etc 
leu 


ate 
ile 


ctt 
leu 


33 v y u y yy*- 
gly ala gly 


cgt caa 
arg gin 
301/101 


ctg 
leu 


eta 
leu 


cca 
pro 


cct 
pro 


oaa 
glu 


aat caa ate 
asp arg ile 


ctg ggc 
leu gly 
361/121 


ttg 
leu 


teg 
ser 


ttg 
leu 


eta 
leu 


too 
trp 


ata tta caa 
val leu arg 


cgc ccc 
arg pro 
421/141 


acc 
thr 


gcg 
ala 


gcg 
ala 


teg 
ser 


ctg 
leu 


ccc aat ata 
3a w y **y 

pro gly val 


gac ate 
asp ile 
481/161 


gcg 
ala 


gcc 
ala 


cag 
gin 


gta 
val 


gtg 
val 


cac acc gac 
his thr asp 


ate gca 
ile ala 
541/181 


tta 
leu 


ggt 
gly 


gcg 
ala 


gcg 
ala 


ctg 
leu 


aac acc gac 
asn thr asp 


gcc gac 
ala asp 
601/201 


gtc gcg 
val ala 


ggc 
gly 


cag 
gin 


ttc 
phe 


tac acc ctg 
tyr thr leu 


gag gcg 
glu ala 
661/221 


etc 
leu 


gag 
glu 


cat 
his 


ggc 
gly 


egg 
arg 


ate get gtg 
ile ala val 


gcc gca 
ala ala 
721/241 


ccg 
pro 


ttc 
phe 


gaa 
glu 


gcg 
ala 


gcg 
ala 


ttt ctg ate 
phe leu ile 


gga acc 
gly thr 
781/261 


gta 
val 


cag 
gin 


ate 
ile 


gac 
asp 


acg 
thr 


ttc acg cct 
phe thr pro 


gag gtc 
glu val 
841/281 


ggc 
gly 


gag 
glu 


get 
ala 


ttg 
leu 


gtc 
val 


teg atg etc 
ser met leu 


aag gcc 
lys ala 


eta 
leu 


get 
ala 


cgc 
arg 


gtc 
val 


gat 
asp 


gag gcc gca 
glu ala ala 



393: 537-544) et contenant la sequence 



31/11 


















egg aaa 
arg lys 
91/31 


acc 
thr 


ggt 
gly 


ccg 
pro 


egg 
arg 


gaa 
glu 


tgc 
cys 


tgc 
cys 


ggg 

gly 


gtc agt 
val ser 
151/51 


cac 
his 


ccc 
pro 


clay 

lys 


acc 
thr 


ttg 
leu 


cgc 
arg 


aag 
lys 


act 
thr 


gga act 
gly thr 
211/71 


cga 
arg 


tgc 
cys 


gaa 
glu 


gga 
gly 


-k 4- mm 

ate 
ile 


agg 
arg 


etc 
leu 


atg 
met 


ate actr* 

y tu y y 

val gly 
271/91 


ggc 
gly 


ctg 
leu 


acc 
thr 


acc 
thr 


gcc 
ala 


gac 
asp 


acc 
thr 


etc 
leu 


ile leu 
331/111 


gtg 
val 


gac 
asp 


agg 
arg 


age 
ser 


ttt 
phe 


gac 
asp 


ggg 

gly 


acg 
thr 


aac t" <*rrr 

y y *~ u yy 
gly trp 
391/131 


c gg 

arg 


egg 
arg 


cct 
pro 


gac 
asp 


gac 
asp 


gtc 
val 


cgc 
arg 


gtc 
val 


gaa atg 
glu met 
451/151 


gtt 
val 


art 

thr 


yea 
ala 


acc 
thr 


gtc 
val 


gcc 
ala 


cac 
his 


att 

ile 


aac age 
asn ser 
511/171 


gtc 
val 


ate 

ile 


ggc 

gly 


Lai 

tyr 


gac 
asp 


gcg 
ala 


ttg 
leu 


gtg 
val 


acc att 
ala val 
571/191 


ccc 
pro 


gly 


leu 


teg 
ser 


gac 
asp 


gcg 

ala 


etc 
leu 


gac 
asp 


aac aac 
asp gly 
631/211 


aca 
y c y 

ala 


y \~ u 

ala 


gag 
glu 


ctg 
leu 


cgt 
arg 


gcg 
ala 


aag 
lys 


gtc 
val 


get ate 
ala ile 
691/231 


gcc 
ala 


ggg 

gly 


gtg 
val 


ccg 
pro 


ttc 
phe 


aaa 
lys 


tgc 
cys 


cca 
pro 


gcc gcc 
ala ala 
751/251 


caa 
gin 


etc 
leu 


ggt 
gly 


gac 
asp 


cgc 
arg 


tac 
tyr 


gcc 
ala 


acc 
thr 


gac ccg 
asp pro 
811/271 


ctg 
leu 


ccg 
pro 


atg 
met 


ccc 
pro 


gtt 
val 


gca 
ala 


ggt 
gly 


ccc 
pro 


aag gat 
lys asp 
871/291 


cac 
his 


ggt 
gly 


gtc 
val 


ggc 
gly 


ttc 
phe 


cat 

his 


cct 
pro 


cgc 
arg 


agg acg 
arg thr 


atg 
met 


cac 
his 


ttc 
phe 


ggt 
gly 


gac 
asp 


ggc 
gly 


acg 
thr 


tec 
ser 



SEQ ID N° 48F 
FIGURE 48F 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



165/185 



901/301 
gaa ccg ttc 
glu pro phe 
961/321 
gcg ggt etc 
ala gly leu 
1021/341 
gac aac gtg 
asp asn val 
1081/361 
ccc aag get 
pro lys ala 
1141/381 
cat etc ggt 
his leu gly 
1201/401 
acc ggt gat 
thr gly asp 
1261/421 
gtg acg ctg 
val thr leu 
1321/441 
tgg ctg acc 
trp leu thr 



gat ctg ctt 
asp leu leu 

age gaa tec 
ser glu ser 

tgg gcc ate 
trp ala ile 

gcc gtg ttc 
ala val phe 

tac gac gta 
tyr asp val 

cac cag gca 
his gin ala 

tac ccg 1 ccg 
tyr pro pro 



gcc gtg 
ala val 

999 tgg 
gly trp 

ggc gat 
gly asp 

gcc gaa 
ala glu 

get gag 
ala glu 

gcc aag 
ala lys 

teg egg 
ser arg 



gtc ccc 
val pro 

ata ccc 
ile pro 

gcg acc 
ala thr 

gcc cag 
ala gin 

cgc cac 
arg his 

ggc gac 
gly asp 

gag ttt 
glu phe 



931/311 
ccg cac gtg 
pro his val 
991/331 
gtg gac ccg 
val asp pro 
1051/351 
gtg ctg acg 
val leu thr 
1111/371 
gcc gca gtt 
ala ala val 
1171/391 
ttc acc ggc 
phe thr gly 
1231/411 
ggc gat ttc 
gly asp phe 
1291/431 
cac gag gag 
his glu glu 



ccc tec gcc gcg gcg egg tea 
pro ser ala ala ala arg ser 

cgc acc ctg tec act age gcc 
arg thr leu ser thr ser ala 

ctg ccg aat ggc aaa ccg ctg 
leu pro asn gly lys pro leu 

gtc gcc cac ggc gtc gcc cgc 
val ala his gly val ala arg 

acg ggc gcc tgc tac gtc gag 
thr gly ala cys tyr val glu 

ttc get ccg teg gcg ccc teg 
phe ala pro ser ala pro ser 

aag gtc gca caa gaa ctg gcc 
lys val ala gin glu leu ala 



cgc tgg aag acg tga 
arg trp lys thr OPA 



SEQ ID N° 48F (suite) 
FIGURE 48F (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



166/185 



Fragment amplifie par PCR d'apres les 
protease de la famille htrA de E. coli 
et du site SnaBI a I'extremite 3') et a 



1/1 


















cca tct 
pro ser 
61/21 


aca 
thr 


cca 
pro 


etc 
leu 


aac 
asn 


age 
ser 


caa 

**yy 
arg 


gec 
ala 


arg 


tga tec 
OPA ser 
121/41 


ata 
val 


aca 
ala 


agt 
ser 


tgt 
cys 


tea 
ser 


tat 
tgt 

cys 


cgc 
arg 


ggc 
gly 


tec etc 

WW \A WW- 

ser val 
181/61 


tga 
OPA 


cca 
pro 


acg 
thr 


gta 
val 


gtt 
val 


cgc 
arg 


tgc 
cys 


tga 
OPA 


tea taa 
ser OPA 
241/81 


aca 
thr 


age 
ser 


tgc 
cys 


gtt 
val 


999 
gly 


tgc 
cys 


tat 
tyr 


tga 
OPA 


caci taa 
arg trp 
301/101 


ccg 
pro 


aaa 

yyy 
gly 


yya 
gly 


tgg 

trp 


ser 


ccc • 
pro 


999 
gly 


ccg 
pro 


can cca 
arg pro 
361/121 


age 
ser 


yyy 
gly 


tgg 
trp 


arg 


gaa 
glu 


ccg 
pro 


acg 
thr 


acc 
thr 


aat taa 
aa u **yy 

asn trp 
421/141 


cca 
pro 


aac 

yy*- 
gly 


taa 
OPA 


gin 


agg 
arg 


r-a t- 

cac 
his 


tea 
ser 


-.4-4- 

att 
ile 


aac aac 
asn gly 
481/161 


aaa 
arg 


caa 
gin 


fine* 

gly 


tgg 

trp 


leu 


ccg 
pro 


acg 
thr 


ccg 
pro 


tac aca 
cys ala 
541/181 


cca 
pro 


atg 
met 


teg 
ser 


aac 
asn. 


tct 
ser 


OPA 


tgg 
trp 


cct 
pro 


aac aaa 
ser arg 
601/201 


aga 
arg 


'too 

u yy 
trp 


tea 
ser 


acc 
thr 


cys 


gtg 
val 


ccg 
pro 


atg 
met 


tgg tag 
trp AMB 
661/221 


gcg 
ala 


att 
ile 


tgg 
trp 


tgg 
trp 


acc 
thr 


tgt 
cys 


ccc 
pro 


gag 
glu 


teg aca 
ser thr 
721/241 


tgg 
trp 


ctg 
leu 


acg 
thr 


teg 
ser 


teg 
ser 


acc 
thr 


gca 
ala 


gee 
ala 


tec ttt 
ser phe 
781/261 


teg 
ser 


acg 
thr 


teg 
ser 


agg 
arg 


tga 
OPA 


ttg 
leu 


ggt 
gly 


ggc 
gly 


gga tgg 
gly trp 
841/281 


cgc 
arg 


tta 
leu 


acc 
thr 


tga 
OPA 


tgg 
trp 


aca 
thr 


acg 
thr 


ccg 
pro 


gtg tea 
val ser 


ggc 
gly 


tga 
OPA 


gee 
ala 


age 
ser 


teg 
ser 


acg 
thr 


cgt 
arg 


cgc 
arg 



similarites de sequences avec une serine 
(creation du site BamHI a 1" extremite 5' 
sus-clone dans le vecteur pJVED: 



31/11 


















cgc tgc 
arg cys 
91/31 


egg 
arg 


teg 
ser 


gtg 
val 


ctg 
leu 


ccg 
pro 


aga 
arg 


agg 
arg 


egg 
arg 


gca cca 
ala pro 
151/51 


ccg 
pro 


ccg 
pro 


acc 
thr 


aac 
asn 


999 
gly 


tgc 
cys 


ttg 
leu 


cca 
pro 


tct cca 
ser pro 
211/71 


aaa 
lys 


gtc 
val 


tea 
ser 


age 
ser 


cca 
pro 


ccg 
pro 


aag 
lys 


cag 
gin 


teg tgg 
ser trp 
271/91 


gtg 
val 


gga 
gly 


teg 
ser 


999 
gly 


tgg 
trp 


egg 
arg 


teg 
ser 


ccg 
pro 


ggc tga 
gly OPA 
331/111 


ggc 
gly 


egg 
arg 


tgg 
trp 


gee 
ala 


gee 
ala 


tea 
ser 


ccg 
pro 


aag 
lys 


tgc ggc 
cys gly 
391/131 


cca 
pro 


tec 
ser 


ccg 
pro 


tct 
ser 


teg 
ser 


gca 
ala 


gcg 
ala 


acg 
thr 


taa tgc 
OCH cys 
451/151 


tgc 
cys 


999 
gly 


cgc 
arg 


tgg 
trp 


ccg 
pro 


agt 
ser 


cac 
his 


999 
gly 


gac atg 
asp met 
511/171 


aat 
asn 


tgc 
cys 


gta 
val 


ccc 
pro 


cgc 
arg 


taa 
OCH 


cgt 
arg 


cgc 
arg 


cga tgg 
arg trp 
571/191 


ccc 
pro 


egg 
arg 


999 
gly 


etc 
leu 


cgc 
arg 


ggc 
gly 


tac 
tyr 


cca 
pro 


tgc tgg 
cys trp 
631/211 


etc 
leu 


aaa 
lys 


teg 
ser 


agg 
arg 


aat 
asn 


tgt 
cys 


cca 
pro 


cac 
his 


gcg acg 
ala thr 
691/231 


ccg 
pro 


gag 
glu 


aag 
lys 


tgg 
trp 


tgc 
cys 


acg 
thr 


age 
ser 


egg 
arg 


tgg age 
trp ser 
751/251 


999 
gly 


tea 
ser 


ggc 
gly 


ggc 
gly 


ggc 
gly 


gca 
ala 


acg 
thr 


ata 
ile 


agg ttt 
arg phe 
811/271 


atg 
met 


gcg 
ala 


ata 
ile 


ccg 
pro 


ctg 
leu 


gat 
asp 


tgt 
cys 


cgc 
arg 


cga agt 
arg ser 
871/291 


gga 
gly 


gee 
ala 


cgc 
arg 


egg 
arg 


gcg 
ala 


gee 
ala 


acg 
thr 


tgg 
trp 


acg ctg 
thr leu 


age 
ser 


tgg 
trp 


tgg 
trp 


ttt 
phe 


ccg 
pro 


acc 
thr 


gcg 
ala 


gee 
ala 



SEQ ID N° 49A 
FIGURE 49A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



167/185 



901/301 






caa aca ttc 

w 33 www 


cca 


tac 

wy w» 


arg ala phe 


nro 


CVS 

J 


961/321 






cac aaa cat 

wow yyy wvjw 


tac 

wvj w. 




his gly arg 


CVS 


ara 


1021/341 






aca aca oat 


tac 

wyv_ 


tgc 


thr ala asp 


CVS 


CVS 


1081/361 






ttt acg tgc 


tac 


tec 


phe thr cys 


CVS 


ser 


1141/381 






aca etc aaa 


aca 


caa 


ala leu gly 


ala 


ara 


1201/401 






etc agt cca 


cac 


aca 


leu ser pro 


ara 


ala 


1261/421 






cca cgc atg 


gee 


aag 


pro arg met 


ala 


lvs 


1321/441 






atg acg aat 


cac 


cca 


met thr asn 


his 


pro 


1381/461 




caq aaa caa 


caa 

W,«\0 


caa 


aln alv aln 

3*** j»"*"Jr y*-** 


aln 


gin 


1441/481 






ccg cag cca 


acc 


caa 


pro gin pro 


thr 


aln 


1501/501 






ata cct ggc 


gtg 


att 


ile pro gly 


val 


ile 


1561/521 






gca ggc atg 


ttg 


gee 


ala gly met 


leu 


ala 


1621/541 






gcg gec gca 


tec 


ctg 


ala ala ala 


ser 


leu 


1681/561 






get gee age 


gcg 


gcg 


ala ala ser 


ala 


ala 


1741/581 






gtg gcg gee 


aag 


gtg 


val ala ala 


lys 


val 


1801/601' 




gag gag ggc 


tec 


ggc 


glu glu gly 


ser 


gly 


1861/621 






ate gcg gcg 


gee 


gee 


ile ala ala 


ala 


ala 



a 99 age gec gtc tgg 
arg ser ala val trp 

gtt egg gec teg ggt 
val arg ala ser gly 

gca teg aag aca ccg 
ala ser lys thr pro 

ccg gec gtc gga tgc 
pro ala val gly cys 

aca teg aga act etc 
thr ser arg thr leu 

caa cct agt tgt gca 
gin pro ser cys ala 

ttg gee cga gta gtg 
leu ala arg val val 

egg tat teg cca ccg 
arg tyr ser pro pro 

acg tac age cag cag 
thr tyr ser gin gin 

tac cgt caa ccc tac 
tyr arg gin pro tyr 

ccg acc atg acg ccc 
pro thr met thr pro 

ate ggc gcg gtg acg 
ile gly ala val thr 

gtc ggg ttc aac egg 
val gly phe asn arg 

cca age ate ccc gca 
pro ser ile pro ala 

gtg ccc agt gtc gtc 
val pro ser val val 

ate att ctg tct gee 
ile ile leu ser ala 

aag cct ccc ctg ggc 
lys pro pro leu gly 



931/311 

tgt ttg aac ggt ttt 
cys leu asn gly phe 
991/331 

tgg cga teg tea aac 
trp arg ser ser asn 
1051/351 

acc cag gcg gee age 
thr gin ala ala ser 
1111/371 

cga ttc cgc age ttc 
arg phe arg ser phe 
1171/391 

ggg gtt egg cga acg 
gly val arg arg thr 
1231/411 

gtt act gtt gaa age 
val thr val glu ser 
1291/431 

ggc eta gta cag gaa 
gly leu val gin glu 
1351/451 

ccg cag cag ccg gga 
pro gin gin pro gly 
1411/471 

ttc gac tgg cgt tac 
phe asp trp arg tyr 
1471/491 

gag gcg ttg ggt ggt 
glu ala leu gly gly 
1531/511 

cct cct ggg atg gtt 
pro pro gly met val 
1591/531 

ata gcg gtg gtg tec 
ile ala val val ser 
1651/551 

gca ccc gee ggc ccc 
ala pro ala gly pro 
1711/571 

gca aac atg ccg ccg 
ala asn met pro pro 
1771/591 

atg ttg gaa acc gat 
met leu glu thr asp 
1831/611 

gag ggg ctg ate ttg 
glu gly leu ile leu 
1891/631 

agt ccg ccg ccg aaa 
ser pro pro pro lys 



acc ggt egg cat egg 
thr gly arg his arg 

agg tgg tgc tea acc 
arg trp cys ser thr 

ccc ctg gaa cgt cga 
pro leu glu arg arg 

ccg gtg cga egg ctg 
pro val arg arg leu 

tta tct cag tgg aat 
leu ser gin trp asn 

cac acc cat gec agt 
his thr his ala ser 

gag caa cct age gac 
glu gin pro ser asp 

acc cca ggt tat get 
thr pro gly tyr ala 

cca ccg tec ccg ccc 
pro pro ser pro pro 

acc egg ccg ggt ctg 
thr arg pro gly leu 

cgc caa cgc cct cgt 
arg gin arg pro arg 

gee ggc ate ggc ggc 
ala gly ile gly gly 

age ggc ggc cca gtg 
ser gly gly pro val 

ggg teg gtc gaa cag 
gly ser val glu gin 

ctg ggc cgc cag teg 
leu gly arg gin ser 

acc aac aac cac gtg 
thr asn asn his val 

acg acg gta 
thr thr val 



SEQ ID N° 49A (suite 1) 
FIGURE 49A (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



168/185 



1/1 








cat eta 


cac 


cqc 


tea 


his leu 


his 


arg 


ser 


61/21 






gat ccg 


tgg 


cga 


gtt 


asp pro 


trp 


arg 


val 


121/41 








ccg tct 


gac 


caa 


egg 


pro ser 


asp 


gin 


arg 


181/61 






cat gaa 


caa 


get 


gcg 


his glu 


gin 


ala 


ala 


241/81 








ggt ggc 


egg 


ggg 


gat 


gly gly 


arg 


gly 


asp 


301/101 








ggc cga 


gcg 


ggt 


ggc 


gly arg 


ala 


gly 


glv 


361/121 






att ggc 


cag 


get 


gac 


ile gly 


gin 


ala 


asp 


421/141 






acg gca 


gac 


aaq 


get 


thr ala 


gly 


lys 


ala 


481/161 








gcg cac 


caa 


tgt 


cga 


ala his 


gin 


cys 


arg 


541/181 








gca gga 


gat 


ggt 


cga 


ala gly 


asp 


gly 


arg 


601/201 








ggt agg 


cga 


ttt 


ggt 


gly arg 


arg 


phe 


gly 


661/221 








cga cat 


ggc 


tga 


cgt 


arg his 


gly 


OPA 


arg 


721/241 








cct ttt 


cga 


cgt 


cga 


pro phe 


arg 


arg 


arg 


781/261 






gat ggc 


get 


taa 


cct 


asp gly 


ala 


OCH 


pro 


841/281 








tgt cag 


get 


gag 


cca 


cys gin 


ala 


glu 


pro 


901/301 








ggg cat 


tec 


cgt 


gca 


gly his 


ser 


arg 


ala 


961/321 






acg ggc 


gtt 


gee 


ggg 


thr gly 


val 


ala 


gly 


1021/341 




egg egg 


att 


get 


gcg 


arg arg 


ile 


ala 


ala 



aca gec ggg cca gac 
thr ala gly pro asp 

gtt cat gtc gcg gcg 
val his val ala ala 

tag ttc get get gat 
AMB phe ala ala asp 

ttg ggt get att gat 
leu gly ala ile asp 

ggt cac ccg ggc egg 
gly his pro gly arg 

gcg aac cga cga cct 
ala asn arg arg pro 

aga ggc att caa ttt 
arg gly ile gin phe 

ggt tac cga cgc egg 
gly tyr arg arg arg 

act ctt gat ggc etc 
thr leu asp gly leu 

cct gcg tgc cga tgt 
pro ala cys arg cys 

gga cct gtc ccg agg 
gly pro val pro arg 

cgt cga ccg cag cct 
arg arg pro gin pro 

ggt gat tgg gtg gca 
gly asp trp val ala 

gat gga caa cgc cgc 
asp gly gin arg arg 

get cga cgc gtc gca 
ala. arg arg val ala 

gga gcg ccg tct ggt 
gly ala pro ser gly 

ttc ggg cct egg gtt 
phe gly pro arg val 

cat cga aga cac cga 
his arg arg his arg 



31/11 

get gee ggt egg tgc 
ala ala gly arg cys 
91/31 

cac cac cgc cga cca 
his his arg arg pro 
151/51 

etc caa aag tct caa 
leu gin lys ser gin 
211/71 

cgt ggg tgg gat egg 
a *g gly trp asp arg 
271/91 

get gag gee ggt ggg 
ala glu ala gly gly 
331/111 

gcg gee cat ccc cgt 
ala ala his pro arg 
391/131 

aat get gcg ggc get 
asn ala ala gly ala 
451/151 

aca tga att gcg tac 
thr OPA ile ala tyr 
511/171 

gat ggc ccc ggg ggc 
asp gly pro gly gly 
571/191 

get ggc tea aat cga 
ala gly ser asn arg 
631/211 

cga cgc egg aga agt 
arg arg arg arg ser 
691/231 

gga gcg ggt cag gcg 
gly ala gly gin ala 
751/251 

ggt tta tgg cga tac 
gly leu trp arg tyr 
811/271 

gaa gtg gag ccc gec 
glu val glu pro ala 
871/291 

cgc tga get ggt ggt 
arg OPA ala gly gly 
931/311 

gtt tga acg gtt tta 
val OPA thr val leu 
991/331 

ggc gat cgt caa aca 
gly asp arg gin thr 
1051/351 

ccc agg egg cca gec 
pro arg arg pro ala 



tgc cga gaa ggc ggt 
cys arg glu gly gly 

acg ggt get tgc cat 
thr gly ala cys his 

gee cac cga age agt 
ala his arg ser ser 

ggt ggc ggt cgc cgc 
gly gly gly arg arg 

ccg cct cac cga age 
pro pro his arg ser 

ctt egg cag cga cga 
leu arg gin arg arg 

ggc cga gtc acg gga 
gly arg val thr gly 

ccc get aac gtc get 
pro ala asn val ala 

tec gcg get acc caa 
ser ala ala thr gin 

gga att gtc cac act 
gly ile val his thr 

ggt gca cga gee ggt 
gly ala arg ala gly 

gcg gcg caa cga tat 
ala ala gin arg tyr 

cgc tgg att gtc gcg 
arg trp ile val ala 

ggg egg cca cgt ggg 
gly arg pro arg gly 

ttc cga ccg egg ccc 
phe arg pro arg pro 

ccg gtc ggc ate ggc 
pro val gly ile gly 

ggt ggt get caa cca 
gly gly ala gin pro 

ccc tgg aac gtc gat 
pro trp asn val asD 



SEQ ID N° 49B 



FEUILLE DE REMFCWBEMEtfPJREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



169/185 



1081/361 

tta cgt get get ccc egg ccg 
leu arg ala ala pro arg pro 
1141/381 

cgc teg gag cac gga cat cga 
arg ser glu his gly his arg 
1201/401 

tea gtc cac gcg cgc aac eta 
ser val his ala arg asn leu 
1261/421 

cac gca tgg cca agt tgg ccc 
his ala trp pro ser trp pro 
1321/441 

tga cga ate acc cac ggt att 
OPA arg ile thr his gly ile 
1381/461 

agg ggc age age aaa cgt aca 
arg gly ser ser lys arg thr 
'1441/481 

cgc age caa ccc agt acc gtc 
arg ser gin pro ser thr val 
1501/501 

tac ctg gcg tga ttc cga cca 
tyr leu ala OPA phe arg pro 
1561/521 

cag gca tgt tgg cca teg gcg 
gin ala cys trp pro ser ala 
1621/541 

egg ccg cat ccc tgg teg ggt 
arg pro his pro trp ser gly 
1681/561 

ctg cca gcg egg cgc caa gca 
leu pro ala arg arg gin ala 
1741/581 

tgg egg cca agg tgg tgc cca 
trp arg pro arg trp cys pro 
1801/601 

agg agg get ccg gca tea ttc 
arg arg ala pro ala ser phe 
1861/621 

teg egg egg ccg cca age etc 
ser arg arg pro pro ser leu 



1111/371 
teg gat gcc gat tec gca get 
ser asp ala asp ser ala ala 

1171/391 
gaa etc teg ggg ttc ggc gaa 
glu leu ser gly phe gly glu 

1231/411 
gtt gtg cag tta ctg ttg aaa 
val val gin leu leu leu lys 

1291/431 
gag tag tgg gcc tag tac agg 
glu AMB trp ala AMB tyr arg 

1351/451 
cgc cac cgc cgc age age egg 
arg his arg arg ser ser arg 

1411/471 
gcc age agt teg act ggc gtt 
ala ser ser ser thr gly val 

1471/491 
aac cct acg agg cgt tgg gtg 
asn pro thr arg arg trp val 

1531/511 
tga cgc ccc etc ctg gga tgg 
OPA arg pro leu leu gly trp 

. 1591/531 
egg tga cga tag egg tgg tgt 
arg OPA arg AMB arg trp cys 

1651/551 
tea acc ggg cac ccg ccg gcc 
ser thr gly his pro pro ala 

1711/571 
tec ccg cag caa aca tgc cgc 
ser pro gin gin thr cys arg 

1771/591 
gtg teg tea tgt tgg aaa ccg 
val ser ser cys trp lys pro 

1831/611 
tgt ctg ccg agg ggc tga tct 
cys leu pro arg gly OPA ser 

1891/631 
ccc tgg gca gtc cgc cgc cga 
pro trp ala val arg arg arg 



tec 
ser 


egg tgc 
arg cys 


gac 
asp 


ggc 

giy 


tgg 
trp 


cgt tat etc 
arg tyr leu 


agt 
ser 


gga 

giy 


ate 
ile 


gcc 
ala 


aca ccc 
thr pro 


atg 
met 


cca 
pro 


gtc 
val 


aag 
lys 


age aac 
ser asn 


eta 
leu 


gcg 
ala 


aca 
thr 


gaa ccc cag 
glu pro gin 


gtt 

val 


atg 
met 


etc 
leu 


acc 
thr 


cac cgt 
his arg 


ccc 
pro 


cgc 
arg 


ccc 
pro 


gta 
val 


ccc ggc 
pro gly 


egg 
arg 


gtc 
val 


tga 
OPA 


ttc gcc aac 
phe ala asn 


gcc 
ala 


etc 
leu 


gtg 
val 


ccg 
pro 


ccg gca 
pro ala 


teg 
ser 


gcg 
ala 


gcg 
ala 


cca 
pro 


gcg gcg 
ala ala 


gcc 
ala 


cag 
gin 


tgg 
trp 


egg ggt egg 
arg gly arg 


teg 
ser 


aac 
asn 


agg 
arg 


ate 
ile 


tgg gcc 
trp ala 


gcc 
ala 


agt 
ser 


egg 
arg 


tga 
OPA 


cca aca 
pro thr 


acc 
thr 


acg 
thr 


tga 
OPA 


aaa 
lys 


cga egg 
arg arg 


ta 
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1/1 








ate tac 


ace 


get 


caa cag 


ile tyr 


thr 


ala 


gin gin 


61/21 








ate cgt 


ggc 


gag 


ttg ttc 


ile arg 


gly 


glu 


leu phe 


121/41 








cgt ctg 


ace 


aac 


aat aat 


arg leu 


thr 


asn 


qlv ser 


181/61 






atg aac 


aag 


ctg 


cgt tgq 


met asn 


lys 


leu 


arg trp 


241/81 








gtg gee 


ggg 


ggg 


atq qtc 


val ala 


gly 


gly 


met val 


301/101 








gee gag 


egg 


gtg 


acq cqa 


ala glu 


arg 


val 


ala arg 


361/121 








ttg gee 


agg 


ctg 


aca qaq 


leu ala 


arg 


leu 


thr glu 


421/141 






cqq caq 


qca 


aqq 


etc att 


arg gin 


ala 


arg 


leu val 


481/161 








egc ace 


aat 


ate 


gaa etc 


arg thr 


asn 


val 


glu leu 


541/181 






cag gag 


atg 


gtc 


qac eta 


gin glu 


met 


val 


asp leu 


601/201 






gta ggc 


gat 


ttg 


gtg gac 


val gly 


asp 


leu 


val asp 


661/221 






gac atg 


get 


gac 


gtc gtc 


asp met 


ala 


asp 


val val 


721/241 








ctt ttc 


gac 


gtc 


gag gtg 


leu phe 


asp 


val 


glu val 


781/261 








atg geg 


ctt 


aac 


ctg atg 


met ala 


leu 


asn 


leu met 


841/281 








gtc agg 


ctg 


age 


cag etc 


val arg 


leu 


ser 


gin leu 


901/301 






ggc att 


ccc 


gtg 


cag gag 


gly ile 


pro 


val 


gin glu 


961/321 






egg gcg 


ttg 


ccg 


ggt teg 


arg ala 


leu 


pro 


gly ser 



170/185 

31/11 

eg ctg ccg gtc ggt get gee gag aag gcg gtg 
hr leu pro val gly ala ala glu lys ala val 
91/31 

gc acc acc gee gac caa egg gtg ctt gee ate 
rg thr thr ala asp gin arg val leu ala ile 
151/51 

tc tec aaa agt etc aag ccc acc gaa gca gtc 

le ser lys ser leu lys pro thr glu ala val 
211/71 

tc gtg ggt ggg ate ggg gtg gcg gtc gee gcg 
le val gly gly ii e gly val ala val ala ala 
271/91 

gg ctg agg ccg gtg ggc cgc etc acc gaa gcg 

ly leu arg pro val gly arg leu thr glu ala 
331/111 

tg egg ccc ate ccc gtc ttc ggc age gac gaa 

eu arg pro ile pro val phe gly ser asp glu 
391/131 

ta atg ctg egg gcg ctg gec gag tea egg gaa 

eu met leu arg ala leu ala glu ser arg glu 
451/151 

ga cat gaa ttg cgt acc ccg eta acg teg ctg 

ly his glu leu arg thr pro leu thr ser leu 
511/171 

eg atg gec ccg ggg get ccg egg eta ccc aag 

er met ala pro gly ala pro arg leu pro lys 

. 571/191 * 

tg ctg get caa ate gag gaa ttg tec aca ctg 

al leu ala gin ile glu glu leu ser thr leu 
631/211 

gc gac gee gga gaa gtg gtg cac gag ccg gtc 

ly asp ala gly glu val val his glu pro val 
691/231 

tg gag egg gtc agg egg egg cgc aac gat ate 

eu glu arg val arg arg arg arg asn asp ile 
751/251 

ag gtt tat ggc gat acc get gga ttg teg egg 

In val tyr gly asp thr ala gly leu ser arq 

811/271 y 

eg aag tgg age ccg ccg ggc ggc cac gtg ggt 

la lys trp ser pro pro gly gly his val qlv 

871/291 

ac get gag ctg gtg gtt tec gac cgc ggc ccg 

is ala glu leu val val ser asp arg gly pro 

931/311 ^ 

tg ttt gaa egg ttt tac egg teg gca teg gca 

al phe glu arg phe tyr arg ser ala ser ala 

991/331 
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1021/341 

ggc gga ttg ctg cgc ate gaa 
gly gly leu leu arg ile glu 
1081/361 

tac gtg ctg etc ccc ggc cgt 
tyr val leu leu pro gly arg 
1141/381 

get egg age acg gac ate gag 
ala arg ser thr asp ile glu 
1201/401 

cag tec acg cgc gca acc tag 
gin ser thr arg ala thr AMB 
1261/421 

acg cat ggc caa gtt ggc ccg 
thr his gly gin val gly pro 
1321/441 

gac gaa tea ccc acg gta ttc 
asp glu ser pro thr val phe 
1381/461 

ggg gca gca gca aac gta cag 
gly ala ala ala asn val gin 
1441/481 

gca gcc aac cca gta ccg tea 
ala ala asn pro val pro ser 
1501/501 

acc tgg cgt gat tec gac cat 
thr trp arg asp ser asp his 
1561/521 

agg cat gtt ggc cat egg cgc 
arg his val gly his arg arg 
1621/541 

ggc cgc ate cct ggt egg gtt 
gly arg ile pro gly arg val 
1681/561 

tgc cag cgc ggc gcc aag cat 
cys gin arg gly ala lys his 
1741/581 

ggc ggc caa ggt ggt gcc cag 
gly gly gin gly gly ala gin 
1801/601 

gga ggg etc egg cat cat tct 
gly gly leu arg his his ser 
1861/621 

cgc ggc ggc cgc caa gcc tec 
arg gly gly arg gin ala ser 



1051/351 
gac acc gac cca ggc ggc 
asp thr asp pro gly gly 

1111/371 
egg atg ccg att ccg cag 
arg met pro ile pro gin 

1171/391 
aac tct egg ggt teg gcg 
asn ser arg gly ser ala 

1231/411 
ttg tgc agt tac tgt tga 
leu cys ser tyr cys OPA 

1291/431 
agt agt ggg cct agt aca 
ser ser gly pro ser thr 

1351/451 
gcc acc gcc gca gca gcc 
ala thr ala ala ala ala 

1411/471 
cca gca gtt cga ctg gcg 
pro ala val arg leu ala 

1471/491 
acc eta cga ggc gtt ggg 
thr leu arg gly val gly 

1531/511 
gac gcc ccc tec tgg gat 
asp ala pro ser trp asp 

1591/531 
ggt gac gat age ggt ggt 
gly asp asp ser gly gly 

1651/551 
caa ccg ggc acc cgc egg 
gin pro gly thr arg arg 

1711/571 
ccc cgc age aaa cat gcc 
pro arg ser lys his ala 

1771/591 
tgt cgt cat gtt gga aac 
cys arg his val gly asn 

1831/611 
gtc tgc cga ggg get gat 
val cys arg gly ala asp 

1891/631 
cct ggg cag tec gcc gcc 
pro gly gin ser ala ala 



cag ccc 
gin pro 


cct gga 
pro gly 


acg 
thr 


teg att 
ser ile 


ctt 
leu 


ccc 
pro 


ggt gcg 
gly ala 


acg 
thr 


get 
ala 


ggc 
gly 


aac 
asn 


gtt 
val 


ate 
ile 


tea 
ser 


gtg 
val 


gaa 
glu 


tct 
ser 


aag cca 
lys pro 


cac 
his 


cca 
pro 


tgc 
cys 


cag 
gin 


tec 
ser 


gga aga 
gly arg 


gca 
ala 


acc 
thr 


tag 
AMB 


cga 
arg 


cat 
his 


ggg aac 
gly asn 


ccc 
pro 


agg 
arg 


tta 
leu 


tgc tea 
cys ser 


tta 
leu 


ccc 
pro 


acc 
thr 


gtc 
val 


ccc 
pro 


gcc 
ala 


ccc 
pro 


tgg 
trp 


tac 
tyr 


ccg 
pro 


gcc 
ala 


ggg 

gly 


tct 
ser 


gat 
asp 


ggt 
gly 


teg 
ser 


cca 
pro 


acg 
thr 


ccc 
pro 


teg 
ser 


tgc 
cys 


gtc 
val 


cgc 
arg 


egg 
arg 


cat 
his 


egg 
arg 


egg 
arg 


cgc 
arg 


ccc cag 
pro gin 


egg 
arg 


egg 
arg 


ccc 
pro 


agt ggc 
ser gly 


gcc ggg 
ala gly 


gtc 
val 


ggt 
gly 


cga 
arg 


aca ggt 
thr gly 


cga 
arg 


tct 
ser 


ggg ccg 

gly pro 


cca 
pro 


gtc gga 
val gly 


ctt 
leu 


gac 
asp 


caa 
gin 


caa 
gin 


cca 
pro 


cgt 
arg 


gat 
asp 


gaa 
glu 


aac 
asn 


gac ggt 
asp gly 


a 
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Sequence codante Rv0983 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq60A: 

1/1 31/11 

gta cag 
val gin 
91/31 
cag ccg 
gin pro 
151/51 
tgg cgt 
trp arg 
211/71 
ttg ggt 
leu gly 
271/91 
ggg atg 
gly met 
331/111 
gtg gtg 
val val 
391/131 
gcc ggc 
ala gly 
451/151 
atg ccg 
met pro 
511/171 
gaa acc 
glu thr 
571/191 
ctg ate 
leu ile 
631/211 
ccg ccg 
pro pro 
691/231 
get gac 
ala asp 
751/251 
ate tec 
ile ser 
811/271 



atg gcc 
Met ala 
61/21 


aag 
lys 


ttg 
leu 


gcc 
ala 


cga 
arg 


gta 
val 


gtg 
val 


ggc eta 
gly leu 


aat cac 
asn his 
121/41 


cca 
pro 


egg 
arg 


tat 
tyr 


teg 
ser 


cca 
pro 


ccg 
pro 


ccg cag 
pro gin 


cag cag 
gin gin 
181/61 


caa 
gin 


a eg 
thr 


tac 
tyr 


age 
ser 


cag 
gin 


cag 
gin 


ttc gac 
phe asp 


cca acc 
pro thr 
241/81 


cag 
gin 


tac 
tyr 


cgt 
arg 


caa 
gin 


ccc 
pro 


tac 
tyr 


gag gcg 
glu ala 


ggc gtg 
gly val 
301/101 


att 
ile 


ccg 
pro 


acc 
thr 


atg 
met 


a eg 
thr 


ccc 
pro 


cct cct 
pro pro 


atg ttg 
met leu 
361/121 


gcc 
ala 


ate 
ile 


ggc 
gly 


gcg 
ala 


gtg 
val 


acg 
thr 


ata gcg 
ile ala 


gca tec 
ala ser 
421/141 


ctg 
leu 


gtc 
val 


ggg 

gly 


ttc 
phe 


aac 
asn 


egg 
arg 


gca ccc 
ala pro 


age gcg 
ser ala 
481/161 


gcg 
ala 


cca 
pro 


age 
ser 


ate 
ile 


ccc 
pro 


gca 
ala 


gca aac 
ala asn 


gcc aag 
ala lys 
541/181 


gtg 
val 


gtg 
val 


ccc 
pro 


agt 
ser 


gtc 
val 


gtc 
val 


atg ttg 
met leu 


ggc tec 
gly ser 
601/201 


ggc 
gly 


ate 
ile 


att 
ile 


ctg 
leu 


tct 
ser 


gcc 
ala 


gag ggg 
glu gly 


gcg gcc 
ala ala 
661/221 


gcc 
ala 


aag 
lys 


cct 
pro 


ccc 
pro 


ctg 
leu 


ggc 

giy 


agt ccg 
ser pro 


ggg egg 
gly arg 
721/241 


acc 
thr 


gca 
ala 


ccc 
pro 


ttc 
phe 


acg 
thr 


gtg 
val 


gtg ggg 
val gly 


cgt gtt 
arg val 
781/261 


cag 
gin 


ggc 
gly 


gtc 
val 


tec 
ser 


ggg 
giy 


etc 
leu 


acc ccg 
thr pro 


gtc ggt 
val gly 


cag 
gin 


ccg 
pro 


gtg 
val 


ctg 
leu 


gcg 
ala 


ate 
ile 


ggg teg 
gly ser 



gaa 
glu 


gag 
glu 


caa 
gin 


cct 
pro 


age 
ser 


gac 
asp 


atg 
met 


acg 
thr 


gga 
gly 


acc 
thr 


cca 
pro 


ggt 

giy 


tat 
tyr 


get 
ala 


cag 
gin 


ggg 

crlv 


tac 
tyr 


cca 
pro 


ccg 
pro 


tec 
ser 


ccg 
pro 


ccc 
pro 


ccg 
pro 


cag 
aln 


ggt 
gly 


acc 
thr 


egg 
arg 


ccg 
pro 


ggt 

giy 


ctg 
leu 


ata 
ile 


cct 
pro 


gtt 
val 


cgc 
arg 


caa 
gin 


cgc 
arg 


cct 
pro 


cgt 
aro 


gca 
ala 


ggc 


tec 
ser 


gcc 
ala 


ggc 
gly 


ate 
ile 


ggc 

gly 


ggc 
gly 


gcg 
ala 


gcc 
ala 


ccc 
pro 


age 
ser 


ggc 

giy 


ggc 
gly 


cca 
pro 


gtg 
val 


get 
ala 


gcc 
ala 


ccg 
pro 


ggg 
giy 


teg 
ser 


gtc 
val 


gaa 
glu 


cag 
gin 


gtg 
val 


gcg 
ala 


gat 
asp 


ctg 
leu 


ggc 
gly 


cgc 
arg 


cag 
gin 


teg 
ser 


gag 
glu 


gag 
glu 


ttg 
leu 


acc 
thr 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


aaa 
lys 


acg 
thr 


acg 
thr 


gta 
val 


acc 
thr 


ttc 
phe 


tct 
ser 


gac 
asp 


CCC 

pro 


acc 
thr 


agt 
ser 


gat 
asp 


ate 
ile 


gcc 
ala 


gtc 
val 


gtc 
val 


ctg 
leu 


ggt 
gly 


tec 
ser 


tec 
ser 


teg 
ser 


gac 
asp 


ctg 
leu 


agg 
arg 


ggt 
gly 


ttg 
leu 


gag 
glu 


ggc 
gly 


acc 
thr 


gtg 
val 


acc 
thr 


acg 
thr 
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841/281 871/291 

ggg ate gtc age get etc aac cgt cca gtg teg acg ace ggc 

gly ile val ser ala leu asn arg pro val ser thr thr gly 

901/301 931/311 

ace gtg ctg gac gec att cag acc gac gec gcg ate aac ccc 

thr val leu asp ala ile gin thr asp ala ala ile asn pro 

961/321 991/331 

ctg gtg aac atg aac get caa etc gtc gga gtc aac teg gee 

leu val asn met asn ala gin leu val gly val asn ser ala 

1021/341 1051/351 

gac tea gec gat gcg cag age ggc teg ate ggt etc ggt ttt 

asp ser ala asp ala gin ser gly ser ile gly leu gly phe 

1081/361 * 1111/371 

gec aag cgc ate gec gac gag ttg ate age acc ggc aag gcg 

ala lys arg ile ala asp glu leu ile ser thr gly lys ala 

1141/381 1171/391 

gtg cag gtg acc aat gac aaa gac acc ctg ggc gec aag ate 

val gin val thr asn asp lys asp thr leu gly ala lys ile 

1201/401 1231/411 

ggt get gec gcg aac get gga gtg ccg aag ggc gtc gtt--gtc 

gly ala ala ala asn ala gly val pro lys gly val val val 

1261/421 " 1291/431 

ccg ate aac age gcg gac gcg ttg gtt gee gec gtg egg tec 

pro ile asn ser ala asp ala leu val ala ala val arg ser 

1321/441 1351/451 

gtg gcg eta acc ttt cag gat ccc teg ggc ggt age cgc aca 

val ala leu thr phe gin asp pro ser gly gly ser arg thr 

1381/461 

aag gcg gag cag tga 
lys ala glu gin OPA 



gag gec ggc 
glu ala gly 


aac 
asn 


cag 
gin 


aac 
asn 


ggt 
gly 


aac 
asn 


tec 
ser 


ggg 

gly 


ggc 
gly 


gcg 
ala 


att 
ile 


gec 
ala 


acg 
thr 


ctg 
leu 


ggc 
gly 


gcg 
ala 


gcg 
ala 


att 
ile 


cca 
pro 


gtc 
val 


gac 
asp 


cag 
gin 


tea 
ser 


cat 
his 


gee 
ala 


tec 
ser 


ctg 

1 At* 

leu 


ggt 
gly 


gtc 
val 


gaa gta 
glu val 


gtg 
val 


gee 
ala 


ggt 
gly 


acc 
thr 


aag gtc 
lys val 


gac 
asp 


gac 
asp 


cgc 
arg 


aaa 
lys 


gcg 
ala 


ccg 
pro 


ggc 

gly 


gee 
ala 


acg 
thr 


gtg 
val 


caa gtc 
gin val 


acc 
thr 


etc 
leu 


ggc 
gly 
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ORF d'apres Cole et al., 1998 (Nature 



1/1 



tga gcc 
OPA ala 
61/21 


age 
ser 


teg 
ser 


acg 
thr 


cgt 
arg 


cgc 
arg 


acg 

ufll 


ctg 
leu 


age 
ser 


ccg tgc 
121/41 


agg 
arg 


age 
ser 


gcc 

ala 


gte 
val 


tgg 
trp 


tgt 
cys 


ttg 
leu 


aac 
asn 


tgc egg 
cvs ara 
181/61 


gtt 
val 


egg 
arg 


gcc 
ala 


teg 
ser 


ggt 
gly 


tgg 

1>X£J 


cga 
arg 


teg 
ser 


tgc tgc 
cvs cvs 
241/81 


gca 
ala 


teg 
ser 


aag 
lvs 


aca 
thr 


ccg 
pro 


acc 

LUX. 


cag 
gin 


gcg 

aid 


tgc tec 
cys ser 
301/101 


ccg 

nro 


gcc 
ala 


gte 
val 


gga tgc 
gly cys 


cga 

d X y 


ttc 
phe 


cgc 
arg 


gca egg 
ala arg 
361/121 


aca 
thr 


teg 
ser 


aga 
arg 


act 
thr 


etc 
leu 


ggg 
yj-y 


gtt 

Vai 


egg 
arg 


cgc gcg 
arcr ala 

J- H »JL»C» 

421/141 


caa 
gin 


cct 

pi V 


agt 


tgt 
cys 


gca 
ala 


gtt 
va j. 


act 
tnr 


gtt 
val 


gcc aag 
ala lys 
481/161 


ttg 
leu 


gcc 
ala 


cga 
arg 


gta gtg 
val val 


ggc 
gly 


eta 
xeu 


gta 
vaj. 


cac cca 
his pro 
541/181 


egg 
ara 


tat 
tvr 


teg 
ser 


cca 
pro 


ccg 
pro 


ccg 
pro 


cag 
gin 


cag 
gxn 


cag caa 
gin gin 
601/201 


acg 
thr 


tac 
tvr 


age 
ser 


cag cag 
gin gin 


ttc 
phe 


gac 
asp 


tgg 

r rn 

trp 


acc cag 
thr gin 
661/221 


tac 
tyr 


cgt 
arg 


caa 
gin 


ccc 
pro 


tac 
tyr 


gaa 
glu 


ceo 
ala 


ttg 
leu 


gtg att 
val ile 
721/241 


ccg 
pro 


acc 
thr 


atg 
met 


acg 
thr 


ccc 
pro 


cct 
pro 


cct 
pro 


ggg 
gly 


ttg gcc 
leu ala 
781/261 


ate 
ile 


ggc 
gly 


gcg 
ala 


gtg 
val 


acg 
thr 


ata 
ile 


gcg 
ala 


gtg 
val 


tec ctg 
ser leu 
841/281 


gte 
val 


ggg 

gly 


ttc 
phe 


aac 
asn 


egg 
arg 


gca 
ala 


ccc 
pro 


gcc 
ala 


gcg gcg 
ala ala 


cca 
pro 


age 
ser 


ate 
ile 


ccc 
pro 


gca 
ala 


gca 
ala 


aac 
asn 


atg 
met 



: 537-544) et contenant Rv0983 



31/11 

A/ A A 
















tgg tgg 
trp trp 
91/31 

^ A/ A 


ttt 
phe 


ccg 
pro 


acc 
thr 


gcg 
ala 


gcc 
ala 


egg 
arg 


gca ttc 
ala phe 


ggt ttt 
gly phe 
151/51 


acc 
thr 


ggt 
gly 


egg 
arg 


cat 
his 


egg 
arg 


cac 
his 


ggg cgt 

gly arg 


tea aac 
ser asn 
211/71 


agg 
arg 


tgg 
trp 


tgc 
cys 


tea 
ser 


acc 
thr 


acg 
thr 


gcg gat 
ala asp 


gcc age 
ala ser 
271/91 


ccc 
pro 


ctg 
leu 


gaa 
glu 


cgt 
arg 


cga 
arg 


ttt 
phe 


acg tgc 
thr cys 


age ttc 
ser phe 
331 /1 1 1 

JJl/ X x x 


ccg 
pro 


gtg 
val 


cga 
arg 


egg 
arg 


ctg 
leu 


gcg 
ala 


etc gga 
leu gly 


cga acg 
arg thr 
391/131 

•J J ±. 1 X*J X 


tta 
leu 


tct 
ser 


cag 
gin 


tgg 
trp 


aat 
asn 


etc 
leu 


agt cca 
ser pro 


gaa age 
glu ser 

451 /I 51 


cac 
his 


acc 
thr 


cat 
his 


gcc 
ala 


agt 
ser 


cca 
pro 


cgc aty 
arg met 


cag gaa 
gin glu 

51 1 /I 71 

w X Xf x*x 


gag 
glu 


caa 
gin 


cct 
pro 


age 
ser 


gac 
asp 


atg 
met 


acg aat 
thr asn 


ccg gga 
pro gly 
571/191 


acc 
thr 


cca 
pro 


ggt 
gly 


tat 
tyr 


get 
ala 


cag 
gin 


ggg cag 
gly gin 


cgt tac 
arg tyr 
631/211 


cca 
pro 


ccg 
pro 


tec 
ser 


ccg 
pro 


ccc 
pro 


ccg 
pro 


cag cca 
gin pro 


ggt ggt 
gly gly 
691/231 


acc 
thr 


egg 
arg 


ccg 
pro 


ggt 
olv 


ctg 
leu 


ata 
ile 


cct ggc 

r» m nit/ 
ytu y xy 


atg gtt 
met val 
751/251 


cgc 
arg 


caa 
gin 


cgc 
arg 


cct 
pro 


cgt 
arg 


gca 
ala 


ggc atg 
gly met 


gtg tec 
val ser 
811/271 


gcc 
ala 


ggc 
gly 


ate 
ile 


ggc 
gly 


ggc 
gly 


gcg 
ala 


gcc gca 
ala ala 


ggc ccc 
gly pro 
871/291 


age 
ser 


ggc 
gly 


ggc 
gly 


cca 
pro 


gtg 
val 


get 
ala 


gcc age 
ala ser 


ccg ccg 
pro pro 


ggg 

gly 


teg 
ser 


gte 
val 


gaa 
glu 


cag 
gin 


gtg 
val 


gcg gcc 
ala ala 



SEQ ID N° 4 9F 
FIGURE 49F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



175/185 



901/301 






aaa gta qtq 


ccc 


aat 


lys val val 


nro 


ser 


961/321 






tec ggc ate 


att 


eta 


ser gly ile 


ile 


leu 


1021/341 






gec gec aag 


cct 


ccc 


ala ala lys 


pro 


pro 


1081/361 






egg acc gca 


ccc 


ttc 


arg thr ala 


pro 


phe 


1141/381 






gtt cag ggc 


qtc 


tec 


val aln alv 


val 




1201/401 






<jqt cag ceo 


ota 


eta 


alv aln oiro 


val 


leu 


1261/421 






ate gtc age 


get 


etc 


lie val ser 


ala 


leu 


1321/441 






gtq ctq qac 


occ 


att 


val leu asp 


ala 


ile 


1381/461 






gtg aac atg 


aac 


act 


val asn met 


asn 


ala 


1441/481 






tea gee gat 


gcg 


cag 


ser ala asp 


ala 


gin 


1501/501 






aag cgc ate 


qcc 


qac 

w w 


lys arg ile 


ala 


asp 


1561/521 






cag gtg acc 


aat 


qac 


gin val thr 


asn 


asp 


1621/541 






get gec gcg 


aac 


get 


ala ala ala 


asn 


ala 


1681/561 






ate aac age 


gcg 


gac 


ile asn ser 


ala 


asp 


1741/581 




gcg eta acc 


ttt 


cag 


ala leu thr 


phe 


gin 


1801/601 






gcg gag cag 


tga 




ala glu gin 


OPA 





gtc gtc atg ttg gaa 
val val met leu glu 

tct gec. gag ggg ctg 
ser ala glu gly leu 

ctg ggc agt ccg ccg 
leu gly ser pro pro 

acg gtg gtg ggg get 
thr val val gly ala 

ggg etc acc ccg ate 
gly leu thr pro ile 

gcg ate ggg teg ccg 
ala ile gly ser pro 

aac cgt cca gtg teg 
asn arg pro val ser 

cag acc gac gee gcg 
gin thr asp ala ala 

caa etc gtc gga gtc 
gin leu val gly val 

age ggc teg ate ggt 
ser gly ser ile gly 

gag ttg ate age acc 
glu leu ile ser thr 

aaa gac acc ctg ggc 
lys asp thr leu gly 

gga gtg ccg aag ggc 
gly val pro lys gly 

gcg ttg gtt gee gec 
ala leu val ala ala 

gat ccc teg ggc ggt 
asp pro ser gly gly 



931/311 

acc gat ctg ggc cgc 
thr asp leu gly arg 
991/331 

ate ttg acc aac aac 
ile leu thr asn asn 
1051/351 

ccg aaa acg acg gta 
pro lys thr thr val 
1111/371 

gac ccc acc agt gat 
asp pro thr ser asp 
1171/391 

tec ctg ggt tec tec 
ser leu gly ser ser 
1231/411 

etc ggt ttg gag ggc 
leu gly leu glu gly 
1291/431 

acg acc ggc gag gee 
thr thr gly glu ala 
1351/451 

ate aac ccc ggt aac 
ile asn pro gly asn 
1411/471 

aac teg gee att gee 
asn ser ala ile ala 
1471/491 

etc ggt ttt gcg att 
leu gly phe ala ile 
1531/511 

ggc aag gcg tea cat 
gly lys ala ser his 
1591/531 

gee aag ate gtc gaa 
ala lys ile val glu 
1651/551 

gtc gtt gtc acc aag 
val val val thr lys 
1711/571 

gtg egg tec aaa gcg 
val arg ser lys ala 
1771/591 

age cgc aca gtg caa 
ser arg thr val gin 



cag 
gin 


teg 
ser 


gag 
glu 


gag ggc 
glu gly 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


gcg 
ala 


acc 
thr 


ttc 
phe 


tct 
ser 


gac ggg 
asp gly 


ate 
ile 


gee 
ala 


gtc 
val 


gtc 
val 


cgt 
arg 


teg 
ser 


gac 
asp 


ctg 
leu 


agg 
arg 


gtc 
val 


acc 
thr 


qta 
val 


acc 
thr 


acg 
thr 


ggg 

gly 


qqc 
gly 


aac 
asn 


caa 
gin 


aac 
asn 


acc 
thr 


tec 
ser 


gly 


ggc 
gly 


gcg 
ala 


ctg 
leu 


acg 
thr 


ctg 
leu 


ggc 
gly 


gcg 
ala 


gac 
asp 


cca 
pro 


gtc 
val 


gac 
asp 


cag gee 
gin ala 


gee 
ala 


tec 
ser 


ctg 
leu 


ggt gtg 
gly val 


gta 
val 


gtg 
val 


gee 
ala 


ggt ggt 
gly gly 


gtc 
val 


gac 
asp 


gac 
asp 


cgc 
arg 


ccg 
pro 


ccg 
pro 


ggc 
gly 


gee 
ala 


acg 
thr 


gtg 
val 


gtc 
val 


acc 
thr 


etc 
leu 


ggc aag 
gly lys 



SEQ ID N° 49F (suite 1) 
FIGURE 49F (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



176/185 

Fragment amplifie par PCR d'apres lea similarites de sequence avec une serine protease de 
la famille HtrA de E. coli (creation du site SnaBI a l'extremite 3') et sous clone dans 
le vecteur pJVEDa: 



1/1 








gat ccg 


gcg 


ggg 


egg 


asp pro 


ala 


gly 


arg 


61/21 








ccg ccg 


ggc 


tgt 


ggg 


pro pro 


gly 


cys 


gly 


121/41 








aca teg 


tea 


gcg; 


gtg 


thr ser 


ser 


ala 


val 


181/61 








acg gcg 


acg 


gcg 


ggg 


thr ala 


thr 


ala 


gly 


241/81 






CCg CjCy 


gcg 


acg 


ggg 


pro ala 


ala 


thr 


gly 


301/101 








gcg gac 


acg 


gcg 


GGC 


ala asp 


thr 


ala 


gly 


361/121 








tgg gcg 


ccg 


egg 


gtg 


trp ala 


pro 


arg 


val 


421/141 








gtg teg 


gcg 


cgt 


ccg 


val ser 


ala 


arg 


pro 


481/161 








teg ggc 


acg 


gcg 


gcg 


ser gly 


thr 


ala 


ala 


541/181 








gcg gcg 


egg 


gcg 


gtg 


ala ala 


arg 


ala 


val 


601/201 






gag ccg 


tea 


egg 


ccg 


glu pro 


ser 


arg 


pro 


661/221 








ggc tga 


teg 


gcc 


acg 


gly OPA 


ser 


ala 


thr 


721/241 








gcc gtg 


acg 


gcg 


ggc 


ala val 


thr 


ala 


gly 


781/261 






gcg acg 


gcg 


ccc 


ccg 


ala thr 


ala 


pro 


pro 


841/281 








ctt tgt 


teg 


gtg 


cac 


leu cys 


ser 


val 


his 


901/301 








cga ggg 


ttt 


egg 


tgc 


arg gly 


phe 


arg 


cys 


961/321 








ttg gtg 


tag 


aaa 


aat 


leu val 


AMB 


lys 


asn 


1021/341 




ccc gac 


aca 


gga 


ggt 


pro asp 


thr 


gly 


gly 


1081/361 






ttg ctg age 


gtg 


ctg 


leu leu 


ser 


val 


leu 


1141/381 






ccg ccg 


gcc 


ttg 


teg 


pro pro 


ala 


leu 


ser 



gtg 
val 


teg 
ser 


gcg 
ala 


cag 
gin 


gcg 
ala 


gcg 
ala 


ccg 
pro 


gcg 
ala 


gcg 
ala 


gcg 
ala 


gag 

glu 


acg 
thr 


gtg 
val 


gcc 
ala 


teg 
ser 


ccg 
pro 


gcg 
ala 


gac 
asp 


acg 
thr 


gcg 

ala 


gcc 
ala 


agg 
arg 


gcg 
ala 


gcg 
ala 


ccg 
pro 


aag 
lys 


gcg 
ala 


gtg 
val 


gta 
val 


ccg 
pro 


gcg 
ala 


ccg 
pro 


gtg 
val 


ggc 
giy 


tga 
OPA 


gcg 
ala 


ggg 

gly 


teg 
ser 


ccg 
pro 


gag 
glu 


ccg 
pro 


gcg 
ala 


gcg 
ala 


ccg 
pro 


gcg 
ala 


ccg 
pro 


gag 
glu 


ggc 

giy 


ace 
thr 


tct 
ser 


gca 
ala 


aca 
thr 


ccg 
pro 


gta 
val 


teg 
ser 


gtg 
val 


gcg 
ala 


ccg 
pro 


gcg 
ala 


gtg 
val 


ccg 
pro 


gtg 
val 


gga 
gly 


acg 
thr 


ggg 

gly 


gca 
ala 


ccg 
pro 


gcg 
ala 


gaa 
glu 


cac 
his 


ccg 
pro 


gcc 
ala 


aac 
asn 


ccg 
pro 


gcg 
ala 


egg 
arg 


tec 
ser 


ggg 

gly 


gca 
ala 


tgg 
trp 


cct 
pro 


gcc 
ala 


gcc 
ala 


egg 
arg 


ace 
thr 


tac 
tyr 


ggg 

gly 


atg 
met 


age 
ser 


aat 
asn 


get 
ala 


gcc 
ala 


gtc 
val 


ggg 

gly 


ctg 
leu 


cag 
gin 


gac 
asp 


egg 
arg 


tt 





31/11 








tgg ctg 


gcg 


ate 


acg 


trp leu 


ala 


val 


thr 


91/31 








gtg gca 


ata 


aca 


aaa 


val ala 


met 


ala 


alv 


151/51 






aca ata 


cca 


ata 


gcg 


ala val 


pro 


val 


ala 


211/71 








aac aaa 


aca 


caa 


teg 


asp lys 


ala 


gin 


ser 


271/91 








ace aca 


gac 


tat 


ggg 


ala ala 


asp 


CVS 


nl v 


331/111 






aaa acc 


cac 


cgc 


tgc 


gly ala 


his 


arg 


t,y:» 


391/131 








teg gca 


acg 


gcg 


ggg 


ser ala 


thr 


ala 


alv 


451/151 






taa aca 


at ci 


ccg 


CtfCt 

gcg 


AMB ala 


val 


Dro 


ala 


511/171 






aaa aca 




gtt 


teg 


glu thr 


ala 


val 


ser 


571/191 








teg gca 


atg 


aca 


aat 


ser ala 


met 


ala 


alv 


631/211 






gtg gcg 


cca 


aca 


gcg 


val ala 


pro 


ala 


ala 


691/231 








ccg gcg 


aaa 


ace 


aca 
y**y 


pro ala 


alv 


thr 


ala 


751/251 








gcg eta 


aca 


gcc 


age 


ala leu 


ala 


ala 


ser 


811/271 








tgc agg 


egg 


cga 


tga 


cys arg 


arg 


arg 


OPA 


871/291 








aca ccg 


gcc 


aac 


ccg 


thr pro 


ala 


asn 


pro 


931/311 






cca tec 


get 


gag 


ctg 


pro ser 


ala 


glu 


leu 


991/331 






ctt aag 


get 


ggg 


aca 


leu lys 


ala 


gly 


thr 


1051/351 






teg cgc cgc 


cgc 


tea 


ser arg 


arg 


arg 


ser 


1111/371 






ggc ctg gcc 


acg 


gcg 


gly leu ala 


thr 


ala 



gcg 
ala 


gtg 
val 


egg 
arg 


gcg 
ala 


gtg 
val 


acg 
thr 


gcg 
ala 


ccg 
pro 


atg 
met 


cca 
pro 


gtg 
val 


gcg 

ala 


gat 
asp 


ggc 
giy 


tct 
ser 


gcc 
ala 


teg 
ser 


gcg 
ala 


gcg 

ala 


gcg 

ala 


gta 
val 


ctg 
leu 


gcg 
ala 


gcg 
ala 


ccg 
pro 


ccg 
pro 


gtc 
val 


agg 
arg 


cag 
gin 


gca 
ala 


ccg 
pro 


gcg 
ala 


gcg 
ala 


acg 
thr 


gcg 

ala 


gga 
gly 


acg 
thr 


cca 
pro 


tgc 
cys 


tga 
OPA 


eta 
leu 


atg 
met 


gcg 
ala 


egg 
arg 


ccg 
pro 


ccg 
pro 


gcg 

ala 


gcc 
ala 


acg 
thr 


gcg 
ala 


teg 
ser 


gtg 
val 


ggg 

gly 


acg 
thr 


cca 
pro 


ccg 
pro 


gag 
glu 


cct 
pro 


tgg 
trp 


ttg 
leu 


tat 
tyr 


acg 
thr 


gca 
ala 


acg 
thr 


gcg 
ala 


gcg 
ala 


gat 
asp 


tgg 
trp 


tga 
OPA 


egg 

arg 


get 
ala 


age 
ser 


ccc 
pro 


gat 
asp 


caa 
gin 


gcg 
ala 


ate 
ile 


tgg 
trp 


act 
thr 


acg 
thr 


att 
ile 


tct 
ser 


gat 
asp 


• age 
ser 


tac 
tyr 


etc 
leu 


agg 
arg 


tgg 
trp 


tea 
ser 


tgg 
trp 


ccg 
pro 


gcc 
ala 


cag 
gin 


gcg 
ala 


gcc 
ala 



SEQ ID N° 50A 
FEUILLE DE REMP^C^E^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



177/185 



1/1 31/11 

ate egg egg ggc ggg tgt egg cgc agg cgt ggc tgg egg tea egg egg tgc ggg egg tgc 
ile arg arg gly gly cya arg arg arg arg gly trp arg aer arg arg cya gly ara cvs 
61/21 91/31 

cgc egg get gtg ggg cgc egg egg egg egg tgg caa tgg egg gaa egg cgc cga tgc caa 
arg arg ala val gly arg arg arg arg arg trp gin trp arg glu arg arg arg cya gln 
121/41 151/51 

cat cgt cag egg tgg aga egg tgg cct egg egg tgc egg tgg egg tgg egg atg get eta 
hia arg gin arg trp arg arg trp pro arg arg cya arg trp arg trp arg met ala leu 
181/61 211/71 

egg cga egg egg ggc egg egg aca egg egg aca agg cgc aat egg cct egg egg egg cgc 
arg arg arg arg gly arg arg thr arg arg thr arg arg aan arg pro arg arg arg arg 
241/81 271/91 

egg egg cga egg ggg cca ggg egg cgc egg ccg egg act gtg ggg tac tgg egg cgc egg 
arg arg arg arg gly pro gly arg arg arg pro arg thr val gly tyr trp arg arg arg 
301/101 331/111 ; m 

egg aca egg egg gca agg egg tgg tac egg ggg ccc acc get gec egg tea ggc agg cat 
arg thr arg arg ala arg arg trp tyr arg gly pro thr ala ala arg aer gly ara hia 
361/121 391/131 y Y 9 

ggg cgc cgc ggg tgg cgc egg tgg get gat egg caa egg egg ggc egg egg cga egg egg 
gly arg arg gly trp arg arg trp ala aap arg gin arg arg gly arg arg arg arg arg 

tgt egg cgc gtc egg egg ggt cgc egg agt agg egg tgc egg egg gaa cgc cat get gat 

cya arg arg val arg arg gly arg arg aer arg arg cya arg arg glu arg hia ala aap 

481/161 511/171 * 

egg gca egg egg cgc egg egg cgc egg egg aga cag cag ttt cgc taa tgg cgc ggc egg 

arg ala arg arg arg arg arg arg arg arg arg gin gin phe arg OCH trp arg gly arc 
541/181 571/191 

egg cgc ggg egg tgc egg agg gca cct ctt egg caa tgg egg gtc egg egg cca egg egg 

arg arg gly arg cya arg arg ala pro leu arg gin trp arg val arg arg pro arg arg 
601/201 631/211 

age cgt cac ggc egg caa cac egg tat egg tgg cgc egg egg cgt egg tgg gga cgc cag 

661/221 1113 ^ ar9 trp 9ly arg gln 

get gat egg cca egg tgg cgc egg egg tgc egg egg gga ccg cgc egg age ctt ggt tgg 
ala aap arg pro arg trp arg arg arg cya arg arg gly pro arg arg aer leu gly tro 
721/241 751/251 

ccg tga egg egg gee egg tgg gaa egg ggg cgc tgg egg cca get ata egg caa egg egg 
pro OPA arg arg ala arg trp glu arg gly arg trp arg pro ala ile arg gln arg arg 
781/261 811/271 * 

cga egg cgc ccc egg cac egg egg aac act gca ggc ggc ggt gag egg att ggt gac ggc 
arg arg arg pro arg hia arg arg aan thr ala gly gly gl y g i u arg ile gly aap gly 
841/281 871/291 1 

ttt gtt egg tgc acc egg cca acc egg cga cac egg cca acc egg eta gee ccg ate aac 
phe val arg cya thr arg pro thr arg arg hia arg pro thr arg leu ala pro ile aan 
901/301 931/311 

gag ggt ttc ggt gee ggt ccg ggg cat ggc cat ccg ctg age tgg cga tct gga eta cgt 
glu gly phe gly ala gly pro gly hia gly hia pro leu aer trp arg aer gly leu ara 
961/321 991/331 

tgg tgt aga aaa ate ctg ccg ccc gga ccc tta agg ctg gga caa ttt ctg ata get acc 
trp cya arg lya ile leu pro pro gly pro leu arg leu gly gln phe leu ile ala thr 
1021/341 1051/351 

ccg aca cag gag gtt acg gga tga gca att cgc gee gee get cac tea ggt ggt cat ggt 
pro thr gln glu val thr gly OPA ala ile arg ala ala ala hia aer gly gly hia alv 
1081/361 1111/371 

tgc tga gcg tgc tgg ctg ccg teg ggc tgg gee tgg cca egg cgc egg ccc agg egg ccc 

1141/38i ala ^ ^ Pr ° Pr ° arg arg Pr ° 

cgc egg cct tgt cgc agg acc ggt t 
arg arg pro cya arg arg thr gly 



SEQ ID N° 50B 



FIGURE 50B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1/1 

tec ggc ggg gcg ggt gtc ggc 
ser gly gly ala gly val gly 
61/21 

gee ggg ctg tgg ggc gec ggc 
ala gly leu trp gly ala gly 
121/41 

ate gtc age ggt gga gac ggt 
ile val aer gly gly asp gly 
181/61 

ggc gac ggc ggg gec ggc gga 
gly asp gly gly ala gly gly 
241/81 

ggc ggc gac ggg ggc cag ggc 
gly gly asp gly gly gin gly 
301/101 

gga cac ggc ggg caa ggc ggt 
gly his gly gly gin gly gly 
361/121 

ggc gec gcg ggt ggc gee ggt 
gly ala ala gly gly ala gly 
421/141 

gtc ggc gcg tec ggc ggg gtc 
val gly ala ser gly gly val 
481/161 

ggg cac ggc ggc gee ggc ggc 
gly his gly gly ala gly gly 
541/181 

ggc gcg ggc ggt gec gga ggg 
gly ala gly gly ala gly gly 
601/201 

gee gtc acg gec ggc aac acc 
ala val thr ala gly asn thr 
661/221 

ctg ate ggc cac ggt ggc gee 
leu ile gly his gly gly ala 
721/241 

cgt gac ggc ggg ccc ggt ggg 
arg asp gly gly pro gly gly 
781/261 

gac ggc gee ccc ggc acc ggc 
asp gly ala pro gly thr gly 
841/281 

ttg ttc ggt gca ccc ggc caa 
leu phe gly ala pro gly gin 
901/301 

agg gtt teg gtg ccg gtc egg 
arg val ser val pro val arg 
961/321 

ggt gta gaa aaa tec tgc cgc 
gly val glu lys ser cys arg 
1021/341 

cga cac agg agg tta egg gat 
arg his arg arg leu arg asp 
1081/361 

get gag cgt get ggc tgc cgt 
ala glu arg ala gly cys arg 
1141/381 

gec ggc ctt gtc gca gga ccg 
ala gly leu val ala gly pro 



178/185 



31/11 



gca 


ggc gtg get ggc 


ggt 


cac 


ala 


gly val ala gly 


gly 


his 




91/31 






ggc 


ggc ggt ggc aat 


ggc 


ggg 


gly 


gly gly gly asn 


gly 


gly 




151/51 




ggc 


etc ggc ggt gee 


ggt 


ggc 


gly 


leu gly gly ala 


gly 


gly 




211/71 




cac 


ggc gga caa ggc 


gca 


ate 


his 


gly gly gin gly 


ala 


ile 




271/91 






ggc 


gee ggc cgc gga 


ctg 


tgg 


gly 


ala gly arg gly 


leu 


trp 




331/111 






ggt 


acc ggg ggc cca 


ccg 


ctg 


gly 


thr gly gly pro 


pro 


leu 




391/131 






ggg 


ctg ate ggc aac 


ggc 


ggg 


gly 


leu ile gly asn 


gly 


gly 




451/151 






gee 


gga gta ggc ggt 


gee 


ggc 


ala 


gly val gly gly 


ala 


gly 




511/171 






gee 


ggc gga gac age 


agt 


ttc 


ala 


gly gly asp ser 


ser 


phe 




571/191 




cac 


etc ttc ggc aat 


ggc 


ggg 


his 


leu phe gly asn 


gly 


gly 




631/211 




ggt 


ate ggt ggc gee 


ggc 


ggc 


gly 


ile gly gly ala 


gly 


gly 




691/231 






ggc 


ggt gee ggc ggg 


gac 


cgc 


gly 


gly ala gly gly 


asp 


arg 




751/251 






aac 


ggg ggc get ggc 


ggc 


cag 


asn 


gly gly ala gly 


gly 


gin 




811/271 




gga 


aca ctg cag gcg 


gcg 


gtg 


gly 


thr leu gin ala 


ala 


val 




871/291 






ccc 


ggc gac acc ggc 


caa 


ccc 


pro 


gly asp thr gly 


gin 


nro 




931/311 






ggc 


atg gee ate cgc 


tga 


get 


gly 


met ala ile arg 


OPA 


ala 




991/331 






ccg 


gac cct taa ggc 


tgg 


gac 


pro 


asp pro OCH gly 


trp 


asp 




1051/351 




gag 


caa ttc gcg ccg 


ccg 


etc 


glu 


gin phe ala pro pro 


leu 




1111/371 




egg 


get ggg cct ggc 


cac 


ggc 


arg 


ala gly pro gly his 


gly 


gtt 








val 









SEQ ID N° 50C 



ggc 
alv 


ggt 
alv 


gcg 
ala 


ggc 

rrl \i 
giy 


ggt 

rrl xt 

giy 


gee 

a! a 
axa 


aac 
asn 


ggc 
alv 


gee 
ala 


gat 

a 


gee 

a1 a 
aid 


aac 
asn 


ggt 

alv 


ggc 
alv 


gga 


tgg 
trp 


etc 

1 All 

leu 


tac 
tyr 


ggc 

rrl \j 


etc 
1 All 


ggc 
gly 


ggc 

giy 


ggc 
giy 


gec 
ala 


ggt 
alv 


act 
thr 


ggc 

rrl \i 


ggc 
gly 


gee 

aid 


ggc 

gly 


ccc 
pro 


ggt 

alv 


cag 
gin 


gca 

al a 
old 


ggc 

gly 


atg 
met 


gee 
ala 


ggc 
alv 


ggc 


gac 


ggc 
gly 


ggt 
gly 


ggg 

gly 


aac 
asn 


gec 

aid 


atg 

net 


ctg 
leu 


ate 
lie 


get 
ala 


aat 
asn 


ggc 

rrl \/ 
gxy 


gcg 

al a 


gee 
oia 


ggc 
giy 


tec 
ser 


ggc 

alv 
gxy 


ggc 

nl \f 

giy 


cac 

hi * 


ggc 

g^y 


gga 
gly 


gtc 
val 


ggt 
alv 


ggg 

alv 
yxy 


gac 
asp 


gee 

did 


agg 
arg 


gee 
ala 


gga 
alv 


gee 
ala 


ttg 
i ah 


gtt 

vdi 


ggc 
gly 


eta 
leu 


tac 
tvr 


ggc 


aac 

"311 


ggc 

gly 


ggc 
gly 


age 
ser 


gga 
alv 


ttg 
leu 


gtg 

val 

Vol 


acg 

fhr 


get 

al -» 
did 


ggc 
gly 


tag 
AMB 


ccc 
pro 


cga 
arg 


tea 
ser 


acg 
thr 


ggc 
gly 


gat 
asp 


ctg 
leu 


gac 
asp 


tac 
tyr 


gtt 

val 


aat 
asn 


ttc 
phe 


tga 
OPA 


tag 
AMB 


eta 
leu 


ccc 
pro 


act 
thr 


cag 
gin 


gtg 
val 


gtc 
val 


atg 
met 


gtt 
val 


gee 
ala 


ggc 
gly 


cca 
pro 


ggc 
gly 


ggc 
gly 


ccc 
pro 



FIGURE 50C 
FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



179/185 

Sequence codante Rv0125 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seqSOA: 

!/l 31/11 

tgg tea 
trp ser 
91/31 
cag gcg 
gin ala 
151/51 
gac ccg 
asp pro 
211/71 
ggc tac 
gly tyr 
271/91 
ctg acc 
leu thr 
331/111 
ggc caa 
gly gin 
391/131 
cag ctg 
gin leu 
451/151 
gag ccc 
glu pro 
511/171 
ggc agg 
gly arg 
571/191 
gag aca 
glu thr 
631/211 
ccc gtc 
pro val 
691/231 
cag ctg 
gin leu 
751/251 
ggc cag 
gly gin 
811/271 
ggc ttg 
gly leu 
871/291 
get ccg 
ala pro 
931/311 
ccg ate 
pro ile 
991/331 



atg age 
Met ser 

61 /91 


aat 
asn 


teg 
ser 


cgc 
arg 


cgc 
arg 


cgc 
arg 


tea 
ser 


etc 
leu 


agg 
arg 


gtc ggg 
val gly 

191 /4 1 

X.C. A/ *! A 


ctg 
leu 


ggc 
gly 


ctg 
leu 


gee 
ala 


acg 
thr 


gcg 
ala 


ccg 
pro 


gec 
ala 


egg ttc 
arg phe 

lfll/61 


gee 
ala 


gac 
asp 


ttc 
phe 


ccc 
pro 


gcg 
ala 


ctg 
leu 


ccc 
pro 


etc 
leu 


cca cag 
pro gin 

241 /R1 

tTl/ OA 


gtg 
val 


gtc 
val 


aac 
asn 


ate 
ile 


aac 
asn 


acc 
thr 


aaa 
lys 


ctg 
leu 


ggc ate 
gly ile 
qoi /mi 

JUl/ AUX 


gtc 
val 


ate 
ile 


gat 
asp 


ccc 
pro 


aac 
asn 


ggt 
gly 


gtc 
val 


gtg 
val 


acc gac 
thr asp 
^61 /i 91 


ate 
ile 


aat 
asn 


gcg 
ala 


ttc 
phe 


age 
ser 


gtc 
val 


ggc 
gly 


tec 
ser 


tat gac 
tyr asp 

421 /141 

t£mX.f A t A 


cgc 
arg 


acc 
thr 


cag 
gin 


gat gtc 
asp val 


gcg 
ala 


gtg 
val 


ctg 
leu 


gcg gcg 
ala ala 
481/161 


ate 
ile 


ggt 
gly 


ggc 
gly 


ggc gtc 
gly val 


gcg 
ala 


gtt 
val 


ggt 
gly 


ggg cag 
gly gin 

541/1 fll 


ggc 
gly 


gga 
gly 


acg 
thr 


ccc 
pro 


cgt 
arg 


gcg 
ala 


gtg 
val 


cct 
pro 


cag gcg 
gin ala 
601/201 

WA/ t, V JL 


teg 
ser 


gat 
asp 


teg 
ser 


ctg acc 
leu thr 


ggt 
gly 


gee 
ala 


gaa 
glu 


gee gcg 
ala ala 

661/221 


ate 
ile 


cag 
gin 


ccc 
pro 


ggt gat 
gly asp 


teg 
ser 


ggc 
gly 


ggg 

gly 


ggt atg 
gly met 
721/241 

« A/ fcll 


aac 
asn 


acg 
thr 


gee 
ala 


gcg 
ala 


tec 
ser 


gat 
asp 


aac 
asn 


ttc 
phe 


att ccg 
ile pro 
781/261 


ate 
ile 


ggg 

gly 


cag 
gin 


gcg atg 
ala met 


gcg 
ala 


ate 
ile 


gcg 
ala 


acc gtt 
thr val 
841/281 


cat 
his 


ate 
ile 


ggg 

olv 


cct 
pro 


acc 
thr 


gee 
ala 


ttc 
phe 


etc 


ggc gca 
gly ala 
901/301 


cga 
arg 


gtc 
val 


caa 
gin 


cgc gtg 
arg val 


gtc 
val 


ggg 

gly 


age 
ser 


ggc gac 
gly asp 
961/321 


gtg 
val 


ate 
ile 


acc 
thr 


gcg 
ala 


gtc 
val 


gac 
asp 


ggc 
gly 


get 
ala 


gcg ctt aac 
ala leu asn 
1021/341 


ggg 

gly 


cat 
his 


cat 
his 


ccc 
pro 


ggt 
gly 


gac 
asp 


gtc 
val 


ggc acg cgt 
gly thr arg 


aca 
thr 


ggg 

gly 


aac 
asn 


gtg 
val 


aca 
thr 


ttg 
leu 


gee 
ala 



tgg 
trp 


ttg 
leu 


ctg 
leu 


age 
ser 


gtg 
val 


ctg 
leu 


get 
ala 


gec 
ala 


gee 
ala 


ccg 
pro 


ccg 
pro 


gec 
ala 


ttg 
leu 


teg 
ser 


cag 
aln 

7*" 


gac 
aso 


tec 
ser 


gcg 
ala 


atg 
met 


gtc 
val 


gee 
ala 


caa 
gin 


gtg 
val 


ggg 

olv 


aac 
asn 


aac 
asn 


gee 
ala 


gtg 
val 


ggc 
olv 


gee 
ala 


ggg 

alv 


acc 
thr 


aac 
asn 


aac 
asn 


cac 
his 


gtg 
val 


ate 
ile 


gcg 
ala 


ggc 
crl v 


gee 

a aci 


acc 
thr 


tac 
tyr 


ggc 
gly 


gtc 
val 


gat 
asp 


gtg 
val 


gtc 
val 


ggg 

gxy 


cgc 
arg 


ggt 
gly 


gee 
ala 


ggt 
gly 


ggc 
glv 


ctg 
leu 


ccg 

nro 


teg 
ser 


gtc 
val 


gtc 
val 


gcg 
ala 


atg 
met 


ggc 
gly 


aac 
asn 


age 
ser 


ggt 
alv 


gtg 
val 


gtc 
val 


gcg 
ala 


etc 
leu 


ggc 
gly 


caa 
gin 


acc 
thr 


gtg 
val 


ttg 
leu 


aac 
asn 


ggg 

gly 


ttg 
leu 


ate 
ile 


cag 
gin 


ttc 
phe 


gat 
aso 


gtc 
val 


aac 
asn 


ggc 
gly 


eta 
leu 


gga 
glv 


cag 
ciln 


gtg 
val 


gtc 
val 


tec 
ser 


cag 
gin 


ggt 
gly 


ggg 
gly 


cag 
gin 


gga 
olv 


ttc 
phe 


gee 
ala 


ate 
ile 


cga 
arg 


teg 
ser 


ggt 
gly 


ggg 

gly 


ggg 

gly 


tea 
ser 


ccc 
pro 


ggt 
gly 


gtt 
val 


gtc 
val 


gac 
asp 


aac 
asn 


aac 
asn 


ggc 
gly 


aac 
asn 


gcg 
ala 


gca 
ala 


agt 
ser 


etc 
leu 


ggc 
gly 


ate 
ile 


tec 
ser 


acc 
thr 


aac 
asn 


teg 
ser 


gee 
ala 


acc 
thr 


gcg 
ala 


atg 
met 


gcg 
ala 


gac 
asp 


gtg 
val 


acc 
thr 


tgg 
trp 


caa 
gin 


acc 
thr 


aag 
lys 


teg 
ser 


ggc 
gly 


ccc 
pro 


ccg 
pro 


gec 
ala 


tga 
OPA 











SEQ ID N° 50D 
FEUILLE DE REMPtD80BHEKTC(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



180/185 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0125: 



1/1 

tag aaa aat cct 
AMB lys asn pro 
61/21 

aca gga ggt tac 
thr gly gly tyr 
121/41 

age gtg ctg get 
ser val leu ala 
181/61 

gee ttg teg cag 
ala leu ser gin 
241/81 

gtc gee caa gtg 
val ala gin val 
301/101 

gtg ggc gee ggg 
val gly ala gly 
361/121 

gtg ate gcg ggc 
val lie ala gly 
421/141 

gtc gat gtg gtc 
val asp val val 
481/161 

ggt ggc ctg ccg 
gly gly leu pro 
541/181 

atg ggc aac age 
met gly asn ser 
601/201 

etc ggc caa ace 
leu gly gin thr 
661/221 

ttg ate cag ttc 
leu ile gin phe 
721/241 

eta gga cag gtg 
leu gly gin val 
781/261 

ggg cag gga ttc 
gly gin gly phe 
841/281 

ggt ggg ggg tea 
gly gly gly ser 
901/301 

gac aac aac ggc 
asp asn asn gly 
961/321 

etc ggc ate tec 

leu gly ile ser 

1021/341 

ace gcg atg gcg 

thr ala met ala 

1081/361 

caa ace aag teg 

gin thr lys ser 

1141/381 

tga 

OPA 



gee gee egg 
ala ala arg 

ggg atg age 
gly met ser 

gee gtc ggg 
ala val gly 

gac egg ttc 
asp arg phe 

ggg cca cag 
gly pro gin 

ace ggc ate 
thr gly ile 

gee acc gac 
ala thr asp 

ggg tat gac 
gly tyr asp 

teg gcg gcg 
ser ala ala 

ggt ggg cag 
gly gly gin 

gtg cag gcg 
val gin ala 

gat gee gcg 
asp ala ala 

gtc ggt atg 
val gly met 

gee att ccg 
ala ile pro 

ccc acc gtt 
pro thr val 

aac ggc gca 
asn gly ala 

acc ggc gac 
thr gly asp 

gac gcg cct 
asp ala leu 

ggc ggc acg 
gly gly thr 



acc ctt 
thr leu 

aat teg 
asn ser 

ctg ggc 
leu gly 

gee gac 
ala asp 

gtg gtc 
val val 

gtc ate 
val ile 

ate aat 
ile asn 

cgc acc 
arg thr 

ate ggt 
ile gly 

ggc gga 
gly gly 

teg gat 
ser asp 

ate cag 
ile gin 

aac acg 
asn thr 

ate ggg 
ile gly 

cat ate 
his ile 

cga gtc 
arg val 

gtg ate 
val ile 

aac ggg 
asn gly 

cgt aca 
arg thr 



31/11 



91/31 
cgc cgc cgc tea etc 
arg arg arg ser leu 

151/51 
ctg gee acg gcg ccg 
leu ala thr ala pro 

211/71 
ttc ccc gcg ctg ccc 
phe pro ala leu pro 

271/91 
aac ate aac acc aaa 
asn ile asn thr lys 

331/111 
gat ccc aac ggt gtc 
asp pro asn gly val 

391/131 
gcg ttc age gtc ggc 
ala phe ser val gly 

451/151 
cag gat gtc gcg gtg 
gin asp val ala val 

511/171 
ggc ggc gtc gcg gtt 
gly gly val ala val 

571/191 
acg ccc cgt gcg gtg 
thr pro arg ala val 

631/211 
teg ctg acc ggt gec 
ser leu thr gly ala 

691/231 
ccc ggt gat teg ggc 
pro gly asp ser gly 

751/251 
gee gcg tec gat aac 
ala ala ser asp asn 

811/271 
cag gcg atg gcg ate 
gin ala met ala ile 

871/291 ' 
ggg cct acc gee ttc 
gly pro thr ala phe 

931/311 
caa cgc gtg gtc ggg 
gin arg val val gly 

991/331 
acc gcg gtc gac ggc 
thr ala val asp gly 

1051/351 
cat cat ccc ggt gac 
his his pro gly asp 

1111/371 
ggg aac gtg aca ttg 
gly asn val thr leu 



tct 
ser 


gat 
asp 


age 
ser 


tac ccc 
tyr pro 


aac 
asp 


agg 
arg 


tgg 
trp 


tea 
ser 


tgg ttg 
trp leu 


eta 
leu 


gee 
ala 


cag 
gin 


gcg 
ala 


gee ccg 
ala pro 


cca 
pro 


etc 
leu 


gac 
asp 


ccg 
pro 


tec acq 
ser ala 


ata 
met 


ctg 
leu 


ggc 
gly 


tac 
tyr 


aac aac 
asn asn 


acc 
ala 


gtg 
val 


ctg 
leu 


acc 
thr 


aac aac 
asn asn 


cac 
his 


tec 
ser 


ggc 
gly 


caa 
gin 


acc tac 
thr tyr 


ggc 
gly 


ctg 
leu 


cag 
gin 


ctg 
leu 


cgc ggt 
arg gly 


gee 
ala 


ggt 
gly 


gag 
glu 


ccc 
pro 


gtc gtc 
val val 


gcg 
ala 


cct 
pro 


ggc 

gly 


agg 
arg 


gtg gtc 
val val 


aca 
ala 


gaa 
glu 


gag 
glu 


aca 
thr 


ttg aac 
leu asn 


aaa 
giy 


ggg 

gly 


ccc 
pro 


gtc 
val 


gtc aac 
val asn 


aac 
gly 


ttc 
phe 


cag 
gin 


ctg 
leu 


tec cag 
ser gin 


ggt 

giy 


gcg 
ala 


ggc 
gly 


cag 
gin 


ate cga 
ile arg 


teg 
ser 


etc 
leu 


ggc 
gly 


teg 
leu 


ggt gtt 
gly val 


gtc 
val 


age 
ser 


get 
ala 


ccg 
pro 


gcg gca 
ala ala 


agt 
ser 


get 
ala 


ccg 
pro 


ate 
ile 


aac teg 
asn ser 


gec 
ala 


gtc 
val 


ate 
ile 


teg 
ser 


gtg acc 
val thr 


tgg 
trp 


gec 
ala 


gag 
glu 


gga 
gly 


ccc ccg 
pro pro 


gec 
ala 



SEQ ID N° 50F 



FEUILLE DE REMfl&SSflER? ^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



181/185 



Pst\ 




FIGURE 51A 



phoA stop RBS luc 
► w 

CGCTCTGGGGCTCAAAf^CTGCAG ^AGG^ AGATCCAAATG 

Pst\ 



FIGURE 51B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



182/185 

Experiences d' hybridation molfeculaire d f une sonde sp6cifique 
du DP428 sur l'ADN g6nomique de diff6rentes esp£ces de 
mycobact6ries 



1 2 3 4 56 7 8 9 10111213 




■A 



1: M. tuberculosis 2: M. bovia 3: BCG 4: M. africanum 5: cancelled 6: M. 
fortuitum 7: M. simiae 8: M. avium 9: M. chelonae 10: M. flavescens 11: M. 
gordonae 12: M. marinum 13: M. kanaasii 



FIGURE 52 

FEUILLE DE flEMPUCEMEWT (RE6LE 26) 



WO 99/09186 PCT/FR98/01813 

183/185 




L « 

CD 
> 



co co -d- cvi o 

01- X 



FEUILLE DE. REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



184/185 



I COCO 



I0CO- 




100- 



J2 

CD 



CO 

a 

X 



CO 

Q 

J* 

CD 



CL 
w 
C) 



£3 RLU^IO.J/IUDOfiCOnm 
H PhoA unitdj l/bicnirrj 



FIGURE 54 
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lOO 



signal sequence 
I I 



C terminus 




RR 



LPISG 



FEU1LLE DE REM PUK2E3BEHT $HEGLE 26) 



) 




FEUILLE DE REMPLACEMENT (REGLE 26) 



